3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
AIエージェント GitHub omnigent
Omnigentは、Claude Code、Codex、Pi、およびユーザーが作成したカスタムエージェントを含む、あらゆるAIエージェン…
★ 5.1k ⑂ 622 Apache-2.0 2026-06-27
マルチモーダル GitHub PixelRAG
PixelRAGは、ウェブページ、PDF、画像をスクリーンショットとして視覚的にレンダリングし、ビジョン言語モデルで埋め…
★ 5.0k ⑂ 387 Apache-2.0 2026-06-24
LLM GitHub loop-engineering
Loop Engineeringは、GrokやClaude CodeなどのAIコーディングエージェントのプロンプトとオーケストレーションを行う…
★ 2.2k ⑂ 310 MIT 2026-06-26
LLM GitHub memory-os
Memory OSは、Hermes Agentに永続的な長期記憶機能を提供する7層構造のメモリオペレーティングシステムです。エージ…
★ 1.2k ⑂ 113 MIT 2026-06-10
音声生成 / TTS GitHub AI-Video-Studio-2026-Automated-Video-Creation-with-Realistic-AI-Voice-85-Dialects
AI Video Studioは、最先端のAIを活用してプロフェッショナルな動画作成を自動化するオープンソースプラットフォーム…
★ 1 2026-06-18
音声生成 / TTS GitHub LA-Studio
LA Studioは、音声認識、テキスト読み上げ、音声クローン、音声デザイン、モデルダウンロード、ランタイム管理を一つ…
★ 25 ⑂ 11 GPL-3.0 2026-06-26
ComfyUI GitHub ComfyUI-Voice
ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…
★ 1 Apache-2.0 2026-06-18
AIエージェント GitHub vscode-browser-test
このツールは、ClaudeなどのAIコーディングエージェントがVS Codeに組み込まれているブラウザツールを使って、Playwr…
★ 1 MIT 2026-06-18
⚖️GitHub vs HuggingFace TOP 両方を一画面で比較
画像生成 GitHub stable-diffusion-webui
Stable Diffusion web UIは、Gradioライブラリで実装された、画像生成AI「Stable Diffusion」の多機能なWebインター…
★ 163.9k ⑂ 30.4k AGPL-3.0 2026-03-02
画像生成 GitHub LocalAI
LocalAIは、大規模言語モデル(LLMs)、視覚、音声、画像、ビデオなど、様々なAIモデルをどんなハードウェア環境でも…
★ 47.2k ⑂ 4.2k MIT 2026-06-28
画像生成 GitHub khoj
Khojは、個人の能力を拡張するAIセカンドブレインアプリです。ローカルまたはオンラインのLLM(llama3, GPT, Gemini…
★ 35.4k ⑂ 2.3k AGPL-3.0 2026-06-24
画像生成 GitHub diffusers
🤗 Diffusersは、画像、音声、分子の3D構造生成のための最先端の拡散モデルを提供するPythonライブラリです。シンプ…
★ 33.9k ⑂ 7.1k Apache-2.0 2026-06-27
画像生成 GitHub ilab-gpt-conjure
iLab GPT Conjure は、GPT-image-2 に特化した AI 画像生成のためのWebUIワークベンチです。Codex Responses および …
★ 577 ⑂ 80 AGPL-3.0 2026-06-21
画像生成 GitHub ian-xiaohei-scenes
このリポジトリは、AIエージェントが中国語の記事、投稿、チュートリアル、ケーススタディ、プロジェクトレビュー、…
★ 291 ⑂ 28 MIT 2026-06-04
画像生成 GitHub Local-AI-Image-Generator
「Local AI Image Generator」は、Windowsユーザー向けに設計された、セットアップ不要のAI画像生成デスクトップツー…
★ 241 ⑂ 81 MIT 2026-06-25
画像生成 GitHub illo-skill
illoは、アイデアや記事をオリジナルのプリントスタイル編集イラストに変換するAIエージェントスキルです。特徴とし…
★ 228 ⑂ 9 MIT 2026-06-23
画像生成 GitHub openai-compatible-imagegen
このリポジトリは、OpenAI互換の画像APIを通じてエージェントクライアントが画像生成、編集、バッチ処理を行うための…
★ 10 ⑂ 2 MIT 2026-06-22
画像生成 GitHub Typhoonminigen
Typhoonminigenは、Apple Silicon搭載Mac専用のmacOSネイティブ画像生成アプリケーションです。FLUX.2 Kleinモデルを…
★ 4 MIT 2026-06-17
画像生成 GitHub AI-Canva-Style-Editor
AI-Canva-Style-Editorは、StreamlitとOpenAIを基盤としたAI画像生成・編集プラットフォームです。テキストプロンプ…
★ 2 MIT 2026-06-21
画像生成 GitHub card-news-mcp
card-news-mcpは、テキストと背景画像からInstagramスタイル(720x720 PNG)の美しいカードニュースを自動生成するMC…
★ 1 MIT 2026-06-16
画像生成 GitHub OpenMontage
OpenMontageは、世界初となるオープンソースのエージェント型動画制作システムです。AIコーディングアシスタントを本…
★ 24.5k ⑂ 2.7k AGPL-3.0 2026-06-26
動画生成 GitHub Open-Generative-AI
Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…
★ 21.6k ⑂ 3.7k MIT 2026-06-28
動画生成 GitHub LivePortrait
LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…
★ 18.6k ⑂ 1.9k NOASSERTION 2026-06-01
動画生成 GitHub Wan2.2
Wan2.2は、オープンで先進的な大規模ビデオ生成モデルWanの主要なアップグレード版です。専門家混合(MoE)アーキテ…
★ 16.4k ⑂ 2.0k Apache-2.0 2026-03-17
動画生成 GitHub Bernini
Berniniは、MLLMベースのセマンティックプランナーとDiTベースのレンダラーを組み合わせた、ビデオ生成および編集の…
★ 954 ⑂ 74 Apache-2.0 2026-06-22
動画生成 GitHub ai-shortVideo-pipeline
myAiVideosは、AIを活用した中国語短編動画の自動制作パイプラインです。トピック発見からクリエイティブ生成、視覚…
★ 427 ⑂ 3 MIT 2026-06-15
動画生成 GitHub awesome-ad-video-prompts
「Awesome AI Video-Ad Prompts」は、AI動画広告向けの高品質なプロンプトを厳選したオリジナルコレクションです。Se…
★ 153 ⑂ 7 NOASSERTION 2026-06-16
動画生成 GitHub avatar-mix
このツールは、HeyGenアバターとカスタムアニメーション背景(HyperFrames)、音楽、状況に応じた効果音、Hormoziス…
★ 104 ⑂ 14 MIT 2026-06-16
動画生成 GitHub bony-agent
「Bony Agent」は「AI Media Agent」として、AIを活用したフルスタックのコンテンツ制作・配信プラットフォームです…
★ 8 ⑂ 1 2026-06-17
動画生成 GitHub llm-video-maker
このLLM Video Makerは、AIコーディングエージェント(Claude Code、Cursor、Codex、Windsurf、Geminiなど)向けのス…
★ 3 MIT 2026-06-17
動画生成 GitHub muapi-ai-sdk-provider
「@muapi/ai-sdk-provider」は、Vercel AI SDKと統合するためのMuAPIプロバイダーです。Flux、Veo3、Kling、Midjourn…
★ 2 2026-06-17
動画生成 GitHub awesome-ad-video-prompts
「Awesome AI Video-Ad Prompts」は、AI動画広告向けの高品質なプロンプトを厳選したオリジナルコレクションです。Se…
★ 153 ⑂ 7 NOASSERTION 2026-06-16
ComfyUI GitHub ComfyUI
ComfyUIは、画像、ビデオ、3Dモデル、オーディオなどのコンテンツをAIで生成するための強力かつモジュール式のエンジ…
★ 118.6k ⑂ 13.9k GPL-3.0 2026-06-28
ComfyUI GitHub Pixelle-Video
Pixelle-Videoは、入力されたテーマに基づいて、AIが短尺動画を全自動で生成するエンジンです。動画のスクリプト作成…
★ 23.7k ⑂ 3.4k Apache-2.0 2026-06-14
ComfyUI GitHub StabilityMatrix
Stability Matrixは、Stable Diffusion向けのマルチプラットフォームパッケージマネージャーおよび推論UIです。AUTOM…
★ 8.4k ⑂ 575 AGPL-3.0 2026-06-16
ComfyUI GitHub fast-stable-diffusion
TheLastBen/fast-stable-diffusionは、Google Colab上でStable Diffusion環境を迅速に構築・実行するためのノートブ…
★ 7.9k ⑂ 1.4k MIT 2025-11-29
ComfyUI GitHub comfy-skills
Comfy-Org/comfy-skillsは、AIコーディングエージェントがComfy Cloudを介して、画像、ビデオ、オーディオ、3Dコンテ…
★ 41 MIT 2026-06-18
ComfyUI GitHub Dots-TTS-ComfyUI
このツールは、ComfyUI向けのカスタムノードコレクションであり、Dots TTSによる高品質なテキスト音声合成、音声クロ…
★ 31 ⑂ 3 Apache-2.0 2026-06-11
ComfyUI GitHub ComfyUI-LongCat-Avatar
rookiestar28/ComfyUI-LongCat-Avatarは、ComfyUI用のカスタムノード集で、LongCat Video Avatar 1.5のオーディオ駆…
★ 22 ⑂ 2 MIT 2026-06-15
ComfyUI GitHub gamentic
「Gamentic」は、自己ホスト型でブラウザからプレイできるAIダンジョンRPGです。AIナレーターと個性豊かなAIキャラク…
★ 13 ⑂ 4 MIT 2026-06-20
ComfyUI GitHub ComfyUI-Voice
ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…
★ 1 Apache-2.0 2026-06-18
ComfyUI GitHub awesome-ai-video-editing
このリポジトリは、AIを活用した動画編集および制作ツールの厳選リストです。特に、Claude Codeスキル、MCPサーバー…
★ 1 CC0-1.0 2026-06-12
ComfyUI GitHub Zonos2_TTS-ComfyUI
このツールは、Zyphra/ZONOS2モデルをComfyUIで利用するためのカスタムノード集です。テキスト読み上げ、音声のみで…
★ 12 ⑂ 2 MIT 2026-06-14
ComfyUI GitHub comfyui-mcp-panel
「ComfyUI MCP Panel」は、ComfyUIのサイドバーにClaude Codeセッションを統合し、AIエージェントがComfyUIのグラフ…
★ 3 ⑂ 2 MIT 2026-06-27
AIエージェント GitHub langflow
Langflowは、AIエージェントやAIを活用したワークフローを構築・デプロイするための強力なプラットフォームです。視…
★ 150.2k ⑂ 9.4k MIT 2026-06-28
AIエージェント GitHub Front-End-Checklist
Front-End Checklistは、人間とAIエージェント向けに設計されたオープンソースのフロントエンド品質システムです。フ…
★ 73.0k ⑂ 6.7k 2026-06-18
AIエージェント GitHub learn-claude-code
本リポジトリ「Learn Claude Code」は、Claudeなどの大規模言語モデル(LLM)を活用したリアルなエージェント製品開…
★ 68.8k ⑂ 11.2k MIT 2026-06-26
AIエージェント GitHub ruflo
Rufloは、Agenticなワークフローを構築・実行するためのツールです。Web UIを通じて、エージェントベースの目標計画…
★ 61.8k ⑂ 7.2k MIT 2026-06-28
AIエージェント GitHub omnigent
Omnigentは、Claude Code、Codex、Pi、およびユーザーが作成したカスタムエージェントを含む、あらゆるAIエージェン…
★ 5.1k ⑂ 622 Apache-2.0 2026-06-27
AIエージェント GitHub sandboxd
sandboxdは、AIアプリビルダー製品向けのオープンソースバックエンドエンジンです。各ユーザーに独立したクラウド開…
★ 691 ⑂ 32 MIT 2026-06-25
AIエージェント GitHub burner-agents
Burner Agentsは、Web上での永続的な追跡やプロファイリングを避けるために設計された、使い捨てエージェントの群れ…
★ 655 ⑂ 24 MIT 2026-06-16
AIエージェント GitHub munder-difflin
Munder Difflinは、Claude Code、Antigravity (Gemini)、OpenAI Codexといった既存のターミナルエージェントCLIを統…
★ 569 ⑂ 59 NOASSERTION 2026-06-23
AIエージェント GitHub polaris
日本語の要約(200〜400文字、何ができるツールか・特徴・想定ユーザーを含める)
★ 1 AGPL-3.0 2026-06-26
AIエージェント GitHub vscode-browser-test
このツールは、ClaudeなどのAIコーディングエージェントがVS Codeに組み込まれているブラウザツールを使って、Playwr…
★ 1 MIT 2026-06-18
AIエージェント GitHub geomacro-oracle
GeoMacro Oracleは、現実世界の出来事を機械が読み取り可能なリスクシグナルに変換する自律的な地政学的インテリジェ…
★ 2 MIT 2026-06-26
AIエージェント GitHub leopold
Leopoldは、Claude Codeのための自律的なオーケストレーションハーネスです。ユーザーがClaude Codeと議論するように…
★ 4 MIT 2026-06-22
LLM GitHub everything-claude-code
Everything Claude Codeは、Claude CodeやCodex、Cursor、OpenCode、Geminiなど複数のAIエージェント実行環境を強化…
★ 222.4k ⑂ 34.0k MIT 2026-06-25
LLM GitHub hermes-agent
Hermes Agentは、CLIと各種メッセージング基盤を横断して使える自己改善型AIエージェントです。会話履歴検索、永続メ…
★ 198.0k ⑂ 35.1k MIT 2026-06-20
LLM GitHub AutoGPT
AutoGPTは、継続実行型のAIエージェントを構築・配備・運用できるプラットフォームです。低コードのAgent Builderで…
★ 185.2k ⑂ 46.1k NOASSERTION 2026-06-27
LLM GitHub ollama
Ollamaは、GemmaやQwenなどのオープンモデルをローカル環境で手早く実行・管理できるツールです。macOS/Windows/Linu…
★ 175.0k ⑂ 16.7k MIT 2026-06-27
LLM GitHub ponytail
Ponytailは、AIエージェントに「最も怠惰なシニア開発者」のように思考させるツールです。AIエージェントがコードを…
★ 59.4k ⑂ 3.0k MIT 2026-06-26
LLM GitHub loop-engineering
Loop Engineeringは、GrokやClaude CodeなどのAIコーディングエージェントのプロンプトとオーケストレーションを行う…
★ 2.2k ⑂ 310 MIT 2026-06-26
LLM GitHub memory-os
Memory OSは、Hermes Agentに永続的な長期記憶機能を提供する7層構造のメモリオペレーティングシステムです。エージ…
★ 1.2k ⑂ 113 MIT 2026-06-10
LLM GitHub superlog
Superlogは、AIエージェントを活用してソフトウェアの自己修復を可能にするオープンソースの可観測性ツールです。ト…
★ 936 ⑂ 69 Apache-2.0 2026-06-26
LLM GitHub RoboGuard-RLAIF
このRoboGuardは、産業用ロボットUR10eのマニュアルに基づいた技術サポートを提供するエンタープライズRAGエージェン…
★ 1 2026-06-24
LLM GitHub modelfaucet
ModelFaucetは、オープンソースのLLM配信ゲートウェイと組み込み可能なSDKです。あらゆるウェブサイト、アプリケーシ…
★ 2 NOASSERTION 2026-06-22
LLM GitHub ollama-secure-gateway
このツールは、Ollamaサーバーとモバイル/ウェブアプリケーションを安全に接続するためのNode.js Expressミドルウェ…
★ 1 2026-06-18
LLM GitHub GEORank
GEOrankは、GEO(生成式エンジン最適化)に特化したオープンソースのワークベンチです。AI検索におけるウェブサイト…
★ 3 ⑂ 1 Apache-2.0 2026-06-18
マルチモーダル GitHub anything-llm
AnythingLLMは、ドキュメントとのチャットやAIエージェントの利用を可能にするオールインワンのAI生産性向上ツールで…
★ 62.2k ⑂ 6.8k MIT 2026-06-27
マルチモーダル GitHub UI-TARS-desktop
UI-TARS-desktopは、マルチモーダルAIエージェントスタックTARSの一部であり、UI-TARSモデルに基づくネイティブGUIエ…
★ 37.4k ⑂ 3.8k Apache-2.0 2026-06-18
マルチモーダル GitHub LLaVA
LLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ…
★ 24.9k ⑂ 2.8k Apache-2.0 2024-08-12
マルチモーダル GitHub unilm
このGitHubリポジトリ「microsoft/unilm」は、Microsoftが提供する、タスク、言語、モダリティ(テキスト、画像、音…
★ 22.2k ⑂ 2.7k MIT 2026-01-23
マルチモーダル GitHub PixelRAG
PixelRAGは、ウェブページ、PDF、画像をスクリーンショットとして視覚的にレンダリングし、ビジョン言語モデルで埋め…
★ 5.0k ⑂ 387 Apache-2.0 2026-06-24
マルチモーダル GitHub llm-intern-skill
「LLMInternSkill」は、大規模言語モデル(LLM)関連のインターンシップやAI分野での就職活動を目指す学生・求職者向…
★ 214 ⑂ 9 MIT 2026-06-04
マルチモーダル GitHub cc-VisionRouter
cc-VisionRouterは、Claude Code環境で画像非対応のLLMを利用する際に、画像を含むリクエストを自動的にマルチモーダ…
★ 102 MIT 2026-06-07
マルチモーダル GitHub OmniVideo-100K
「OmniVideo-100K」は、音声・視覚推論能力の向上を目指す大規模データセットと、そのための自動データ合成エンジン…
★ 54 ⑂ 2 Apache-2.0 2026-06-19
マルチモーダル GitHub radscore
radscoreは、AI生成の放射線レポートを評価するための軽量なPythonツールキットです。BLEU、ROUGE、BERTScoreといっ…
★ 1 NOASSERTION 2026-06-16
マルチモーダル GitHub blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
マルチモーダル GitHub latent-gate
LatentGateは、VL-JEPAに着想を得たパイプラインで、画像や長いテキストなどの複雑な処理をローカルのOllama(無料)…
★ 20 MIT 2026-06-25
マルチモーダル GitHub VisualClaw
VisualClawは、物理世界向けのリアルタイムでパーソナライズされたエージェントを構築するための自己進化型マルチモ…
★ 42 ⑂ 3 MIT 2026-06-16
音声生成 / TTS GitHub unsloth
Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…
★ 67.5k ⑂ 6.1k Apache-2.0 2026-06-28
音声生成 / TTS GitHub Real-Time-Voice-Cloning
このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TT…
★ 60.0k ⑂ 9.4k NOASSERTION 2026-03-09
音声生成 / TTS GitHub GPT-SoVITS
GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-s…
★ 59.1k ⑂ 6.4k MIT 2026-06-20
音声生成 / TTS GitHub TTS
Coqui.aiの🐸TTSは、深層学習を用いた先進的なテキスト音声合成(Text-to-Speech)ライブラリです。1100以上の言語に…
★ 45.6k ⑂ 6.1k MPL-2.0 2024-08-16
音声生成 / TTS GitHub ai-avatar-bot
「AI仮想人ウィジェット」は、Live2Dキャラクターを任意のウェブサイトに簡単に埋め込むことができる音声AIアシスタ…
★ 179 ⑂ 57 NOASSERTION 2026-06-23
音声生成 / TTS GitHub Artemis
「Shiki Natsume」は、四季夏目をキャラクターとする、完全オフライン動作のAIガールフレンドプロジェクトです。Open…
★ 144 ⑂ 8 NOASSERTION 2026-06-26
音声生成 / TTS GitHub reels-af
REELS-AFは、AIマルチエージェントシステム「AgentField」上で構築されたAIネイティブな動画生成ツールです。記事URL…
★ 85 ⑂ 32 Apache-2.0 2026-06-05
音声生成 / TTS GitHub Core-AI-Framework-Lab
Appleの新しい「CoreAI.framework」を探索するための初期ラボプロジェクトです。Xcode 27 beta、Swift 6.4、iOS 27ま…
★ 59 ⑂ 2 MIT 2026-06-24
音声生成 / TTS GitHub AI-Video-Studio-2026-Automated-Video-Creation-with-Realistic-AI-Voice-85-Dialects
AI Video Studioは、最先端のAIを活用してプロフェッショナルな動画作成を自動化するオープンソースプラットフォーム…
★ 1 2026-06-18
音声生成 / TTS GitHub LA-Studio
LA Studioは、音声認識、テキスト読み上げ、音声クローン、音声デザイン、モデルダウンロード、ランタイム管理を一つ…
★ 25 ⑂ 11 GPL-3.0 2026-06-26
音声生成 / TTS GitHub zotero-minimax-tts
「MiniMax SAPI5 TTS Bridge」は、クラウドまたはローカルのテキスト読み上げ(TTS)サービスが提供する音声を、Wind…
★ 1 MIT 2026-06-17
音声生成 / TTS GitHub NeuralVoice-Studio-AI-Text-to-Speech-with-85-Dialects-Offline-Lightweight
NeuralVoice Studioは、85の言語と方言に対応した次世代オープンソースAI音声ジェネレーターです。このツールは高度…
★ 2 2026-06-17
音楽生成 GitHub Amphion
Amphionは、音声、音楽、スピーチ生成のためのオープンソースツールキットです。再現可能な研究を支援し、音声生成分…
★ 9.9k ⑂ 819 MIT 2026-03-25
音楽生成 GitHub introtodeeplearning
MIT 6.S191「Introduction to Deep Learning」の公式コードとソフトウェアラボ資料を提供するリポジトリです。本コー…
★ 8.7k ⑂ 4.5k MIT 2026-01-04
音楽生成 GitHub YuE
YuEは、歌詞からボーカルと伴奏を含む数分間のフルソングを生成できる、オープンソースの音楽生成基盤モデルです。多…
★ 6.3k ⑂ 746 Apache-2.0 2025-06-04
音楽生成 GitHub ace-step-ui
ACE-Step UIは、オープンソースのAI音楽生成モデル「ACE-Step 1.5」のためのプロフェッショナルなユーザーインターフ…
★ 4.2k ⑂ 629 2026-06-04
音楽生成 GitHub theDAW
「theDAW」はGANTASMOが開発したAI音楽制作のためのオールインワンスタジオです。既存のオーディオ、テキストプロン…
★ 68 ⑂ 14 MIT 2026-06-26
音楽生成 GitHub mcp
RunAPI MCP Serverは、AI画像生成、動画生成、音楽作成、テキスト読み上げ、プロンプト検索、モデル発見といった多岐…
★ 51 Apache-2.0 2026-06-24
音楽生成 GitHub AuraDev
AuraDevは、開発者のリアルタイムの認知状態(集中、行き詰まり、デバッグなど)に適応してアンビエント音楽を生成す…
★ 3 GPL-3.0 2026-05-31
音楽生成 GitHub suno-songsmith
このツールは、Claude AI向けのスキルで、Sunoでの楽曲制作において、リリース品質の素材を作成することを支援します…
★ 2 2026-06-04
音楽生成 GitHub theDAW
「theDAW」はGANTASMOが開発したAI音楽制作のためのオールインワンスタジオです。既存のオーディオ、テキストプロン…
★ 68 ⑂ 14 MIT 2026-06-26
音楽生成 GitHub suno-songsmith
このツールは、Claude AI向けのスキルで、Sunoでの楽曲制作において、リリース品質の素材を作成することを支援します…
★ 2 2026-06-04
音楽生成 GitHub ima-skills
本リポジトリは、AI漫画作成、ソーシャルメディア運営、AI画像生成、音楽生成など多岐にわたる25種類のAIスキルをIMA…
★ 2 ⑂ 1 MIT 2026-06-05
音楽生成 GitHub mcp
RunAPI MCP Serverは、AI画像生成、動画生成、音楽作成、テキスト読み上げ、プロンプト検索、モデル発見といった多岐…
★ 51 Apache-2.0 2026-06-24
ASR / 音声認識 GitHub whisper.cpp
whisper.cppは、OpenAIの高性能な音声認識モデルWhisperをC/C++で軽量に実装したライブラリです。依存関係を最小限に…
★ 51.1k ⑂ 5.7k MIT 2026-06-26
ASR / 音声認識 GitHub voicebox
Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。数秒の音声サンプルから…
★ 35.2k ⑂ 4.2k MIT 2026-06-28
ASR / 音声認識 GitHub Handy
Handyは、完全にオフラインで動作する無料のオープンソース音声認識デスクトップアプリケーションです。プライバシー…
★ 25.2k ⑂ 2.1k MIT 2026-06-29
ASR / 音声認識 GitHub llamafile
llamafileは、大規模言語モデル(LLM)を単一の実行可能ファイルとして配布・実行できる革新的なツールです。llama.c…
★ 25.1k ⑂ 1.4k NOASSERTION 2026-06-28
ASR / 音声認識 GitHub SoulX-Transcriber
SoulX-Transcriberは、複数の話者が登場する対話シナリオにおいて、話者特定(ダイアライゼーション)、タイムスタン…
★ 260 ⑂ 14 Apache-2.0 2026-06-22
ASR / 音声認識 GitHub livecaption
livecaptionは、macOS (Apple Silicon) 向けのリアルタイムオンデバイス音声転写および翻訳を行うCLIツールです。UI…
★ 144 ⑂ 18 2026-06-19
ASR / 音声認識 GitHub subforge
SubForgeは、動画字幕制作を再現性のあるAIパイプラインに変えるために設計されたRust製のコマンドラインインターフ…
★ 93 ⑂ 10 MIT 2026-06-01
ASR / 音声認識 GitHub jarvis_ai
J.A.R.V.I.Sは、Hermes Agentをベースにした、アイアンマンスタイルの自律型音声アシスタント兼コマンドセンターです…
★ 79 ⑂ 17 MIT 2026-06-13
ASR / 音声認識 GitHub Jarvis
Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…
★ 1 2026-06-17
ASR / 音声認識 GitHub voice-prompt-tool
「Voice Prompt Tool」は、Windows環境で動作する音声入力ツールです。ホットキーを押すだけで、任意のテキスト入力…
★ 1 2026-06-23
ASR / 音声認識 GitHub jarvis-mac
Jarvis-Macは、macOS上で動作する高度な日本語音声アシスタントです。ユーザーが「ジャービス」と呼びかけることで起…
★ 30 ⑂ 2 MIT 2026-06-19
ASR / 音声認識 GitHub mixpeek-extractors
Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め…
★ 1 MIT 2026-06-16
3D / NeRF GitHub instant-ngp
「NVlabs/instant-ngp」は、ニューラル放射輝度フィールド(NeRF)や符号付き距離関数(SDF)などを雷のように高速に…
★ 17.5k ⑂ 2.1k NOASSERTION 2026-02-02
3D / NeRF GitHub engine
PlayCanvas Engineは、WebGL2とWebGPUをベースにしたオープンソースのゲームエンジンです。Webブラウザ上で動作する…
★ 16.1k ⑂ 1.9k MIT 2026-06-27
3D / NeRF GitHub Meshroom
Meshroomは、複雑なデータ処理パイプラインを作成、管理、実行するためのオープンソースのノードベースのビジュアル…
★ 12.8k ⑂ 1.2k NOASSERTION 2026-06-27
3D / NeRF GitHub nerfstudio
nerfstudioは、NeRF(Neural Radiance Fields)の作成、学習、テストを簡素化するAPIを提供する、コラボレーションし…
★ 11.7k ⑂ 1.6k Apache-2.0 2025-07-29
3D / NeRF GitHub dvlt.cu
dvlt.cuは、NVIDIAのDVLT (Déjà View Looping Transformer) をCUDA/C++で再実装した、依存関係のない高速な3D再構築…
★ 55 ⑂ 8 Apache-2.0 2026-06-04
3D / NeRF GitHub iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 29 2026-06-21
3D / NeRF GitHub splatreg
splatregは、3D Gaussian Splatting(3DGS)スキャン間の位置合わせ(アライメント)と結合を目的としたPythonライブ…
★ 12 BSD-3-Clause 2026-06-25
3D / NeRF GitHub 3D-RGBX
「3D-RGBX」は、CVPR 2026で注目された研究プロジェクトであり、キャリブレーションや深度情報なしで3Dの一貫性を保…
★ 10 ⑂ 2 MIT 2026-06-06
3D / NeRF GitHub EasyTraceSTL
EasyTraceSTLは、3Dプリントメーカー向けの無料、オフラインで非常にシンプルな3Dデザインツールです。画像を取り込…
★ 2 2026-06-17
3D / NeRF GitHub 2D-X-ray-to-3D-Bone-Reconstruction
このAIツールは、標準的な2D X線画像から3D骨格構造を高精度に再構築します。ConvNeXtエンコーダとニューラルインプ…
★ 1 2026-06-15
3D / NeRF GitHub daily-webapp-2026-06-10-gaussiansplatlab
GaussianSplatLabは、リアルタイム放射輝度場レンダリングの画期的な技術である3D Gaussian Splatting (3DGS) の理論…
★ 1 MIT 2026-06-10
3D / NeRF GitHub vision-embodied-ai-roadmap
このプロジェクトは、コンピュータビジョン、3Dビジョン、自動運転、マルチモーダル知覚、具身知能、ロボティクスと…
★ 1 NOASSERTION 2026-06-10
マルチモーダル HF RMBG-1.4
BRIA Background Removal v1.4は、画像内の前景を高精度に切り出して背景を除去できる画像セグメンテーションモデル…
❤ 2.0k ↓ 331.9k other 2025-07-06
マルチモーダル HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 600 ↓ 719.6k mit 2026-02-04
マルチモーダル HF segformer_b2_clothes
このツールは、Hugging Faceの`mattmdjaga/segformer_b2_clothes`リポジトリで提供されるSegFormer B2モデルであり、…
❤ 501 ↓ 148.7k other 2025-09-19
マルチモーダル HF YOLOv8
Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…
❤ 370 ↓ 9.3k agpl-3.0 2026-06-26
その他 GitHub Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
その他 GitHub Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
その他 GitHub my-podcast
「My Podcast Studio」は、AI音声合成とポッドキャストナレーションを提供するオープンソースのSaaSプラットフォーム…
★ 2 ⑂ 4 2026-06-09
LLM GitHub Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 202 ⑂ 20 Apache-2.0 2026-04-26
その他 GitHub Frequencer
Frequencerは、Go言語で開発されたデスクトップアプリケーションです。集中力と注意力を向上させることを目的とし、…
★ 1 2026-03-21