540 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
表示:
定番
全期間の stars 順
画像生成 GitHub stable-diffusion-webui
Stable Diffusion web UIは、Gradioライブラリで実装された、画像生成AI「Stable Diffusion」の多機能なWebインター…
★ 162.9k ⑂ 30.3k AGPL-3.0 2026-03-02
画像生成 GitHub LocalAI
LocalAIは、大規模言語モデル(LLMs)、視覚、音声、画像、ビデオなど、様々なAIモデルをどんなハードウェア環境でも…
★ 46.2k ⑂ 4.1k MIT 2026-05-12
画像生成 GitHub awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.9k ⑂ 1.4k CC0-1.0 2026-05-11
画像生成 GitHub Hunyuan3D-2
Tencent-Hunyuan/Hunyuan3D-2は、大規模Hunyuan3D拡散モデルを活用した高解像度3Dアセット生成システムです。Hunyuan…
★ 13.7k ⑂ 1.4k NOASSERTION 2025-10-28
人気
3か月以内の stars 順
画像生成 GitHub awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.9k ⑂ 1.4k CC0-1.0 2026-05-11
画像生成 GitHub awesome-gpt-image-2
YouMind-OpenLabが提供する「Awesome GPT Image 2 Prompts」は、OpenAIの次世代画像生成モデル「GPT Image 2」に特化…
★ 5.5k ⑂ 496 NOASSERTION 2026-05-12
AIエージェント GitHub awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 5.0k ⑂ 693 MIT 2026-05-11
画像生成 GitHub gpt_image_2_skill
このツールは、OpenAIのGPT Image 2モデルを用いた画像生成のためのプロンプトギャラリー、画像プロンプトライブラリ…
★ 1.9k ⑂ 181 MIT 2026-05-08
最近人気
1か月以内の stars 順
画像生成 GitHub awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.9k ⑂ 1.4k CC0-1.0 2026-05-11
画像生成 GitHub awesome-gpt-image-2
YouMind-OpenLabが提供する「Awesome GPT Image 2 Prompts」は、OpenAIの次世代画像生成モデル「GPT Image 2」に特化…
★ 5.5k ⑂ 496 NOASSERTION 2026-05-12
AIエージェント GitHub awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 5.0k ⑂ 693 MIT 2026-05-11
画像生成 GitHub gpt_image_2_skill
このツールは、OpenAIのGPT Image 2モデルを用いた画像生成のためのプロンプトギャラリー、画像プロンプトライブラリ…
★ 1.9k ⑂ 181 MIT 2026-05-08
新着
新しい repo を優先 画像生成
GitHub mafabi_colab_juggernaut_xl
mafabi_colab_juggernaut_xlは、Google Colab上でStable Diffusion XL (SDXL) のJuggernautバリアントを利用して画像…
★ 1 Apache-2.0 2026-05-11
画像生成
GitHub codex-gpt-image
「Codex GPT Image Skill」は、OpenClaw、Claude Code、Codex、Hermes AgentといったAIエージェント向けに、GPT-Imag…
★ 1 MIT 2026-05-11
画像生成 GitHub KinetiDiff
KinetiDiffは、進行性骨化性線維異形成症(FOP)の原因となるACVR1受容体を標的とするキナーゼ阻害剤を設計するため…
★ 1 MIT 2026-05-11
画像生成 GitHub gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 1 MIT 2026-05-08
定番
全期間の stars 順
動画生成 GitHub LivePortrait
LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…
★ 18.3k ⑂ 1.9k NOASSERTION 2026-03-02
動画生成
GitHub Open-Generative-AI
Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…
★ 12.9k ⑂ 2.3k 2026-05-11
動画生成 GitHub CogVideo
「zai-org/CogVideo」は、テキストや画像から動画を生成する最先端のツールです。CogVideoXシリーズは、テキストから…
★ 12.7k ⑂ 1.3k Apache-2.0 2025-11-04
画像生成 GitHub OpenMontage
OpenMontageは、世界初となるオープンソースのエージェント型動画制作システムです。AIコーディングアシスタントを本…
★ 3.6k ⑂ 728 AGPL-3.0 2026-05-07
人気
3か月以内の stars 順
画像生成 GitHub OpenMontage
OpenMontageは、世界初となるオープンソースのエージェント型動画制作システムです。AIコーディングアシスタントを本…
★ 3.6k ⑂ 728 AGPL-3.0 2026-05-07
動画生成 GitHub AIComicBuilder
AI Comic Builderは、スクリプトからAIを駆使して全自動でアニメーションコミック動画を生成するツールです。AIによ…
★ 1.4k ⑂ 243 Apache-2.0 2026-04-27
動画生成 HF LTX-2.3
LTX-2.3は、Lightricksが公開する音声と映像を同時生成できるDiTベースのオープンウェイト基盤モデルです。画像から…
❤ 1.2k ↓ 1.7M other 2026-04-13
動画生成 GitHub deep-printfilm
「AI 漫劇工場 (AI Comic & Short Drama Studio)」は、短編ドラマ、漫劇、動態漫画、映画の絵コンテ制作者向けのAI制…
★ 984 ⑂ 42 2026-05-07
最近人気
1か月以内の stars 順 動画生成
HF Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 644 ↓ 157.6k 2026-05-08
画像生成 GitHub nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 408 ⑂ 22 MIT 2026-05-05
動画生成
HF LTX2.3-10Eros
10 Erosは、LTX系のimage-to-video向けに調整されたモデル/チェックポイントで、ComfyUIワークフローや専用ノードと…
❤ 223 ↓ 64.0k 2026-05-11
動画生成 GitHub VEFX-Bench
VEFX-Benchは、テキスト駆動型ビデオ編集および視覚効果の総合的な評価ベンチマークです。5,049件のアノテーション付…
★ 150 ⑂ 16 Apache-2.0 2026-04-20
新着
新しい repo を優先 動画生成
GitHub agentic-video-maker
このツールは、単一のブリーフから高品質なAI動画を生成するパイプラインです。Geminiによるスクリプト作成、ElevenL…
★ 2 ⑂ 1 MIT 2026-05-12
動画生成
GitHub ai-content-automation-system
このプロジェクトは、AIまたは手動スクリプト入力からYouTube ShortsやReelsのような短尺縦型動画を自動生成するため…
★ 1 NOASSERTION 2026-05-10
動画生成
GitHub ai-video-creation-resources
「Leadde.ai/ai-video-creation-resources」は、AIビデオ作成、ドキュメントからビデオへの変換、トレーニング、多言…
★ 1 ⑂ 1 2026-05-08
動画生成
GitHub spinforge-ai
SpinForge AIは、Python、Flaskなどを利用して構築された、AIアシスト付きの360°オブジェクトおよびロゴスピンビデオ…
★ 1 MIT 2026-05-06
定番
全期間の stars 順
ComfyUI GitHub ComfyUI
ComfyUIは、画像、ビデオ、3Dモデル、オーディオなどのコンテンツをAIで生成するための強力かつモジュール式のエンジ…
★ 112.5k ⑂ 13.1k GPL-3.0 2026-05-11
ComfyUI GitHub ComfyUI-GGUF
ComfyUI-GGUFは、ComfyUIでGGUF形式の量子化モデルを扱えるようにするカスタムノード集です。特にFLUXやStable Diffu…
★ 3.6k ⑂ 299 Apache-2.0 2026-01-12
ComfyUI GitHub ComfyUI-SeedVR2_VideoUpscaler
ComfyUI-SeedVR2_VideoUpscalerは、高品質なビデオと画像のアップスケーリングを可能にするComfyUI向けの公式SeedVR2…
★ 2.4k ⑂ 181 Apache-2.0 2025-12-24
ComfyUI GitHub ComfyUI-to-Python-Extension
ComfyUIで作成したノードベースのワークフローを、そのまま実行可能なPythonスクリプトへ変換できる拡張ツールです。…
★ 2.3k ⑂ 208 MIT 2026-05-10
人気
3か月以内の stars 順
ComfyUI GitHub locally-uncensored
「Locally Uncensored」は、テキスト、画像、動画の生成をすべてローカル環境で実行できるデスクトップAIアプリケー…
★ 414 ⑂ 55 NOASSERTION 2026-05-11
ComfyUI GitHub ComfyUI-OmniVoice-TTS
ComfyUI-OmniVoice-TTSは、画像生成AIのComfyUI向けに開発された、ゼロショット多言語テキスト読み上げ(TTS)ノード…
★ 372 ⑂ 52 Apache-2.0 2026-05-01
ComfyUI GitHub ComfyUI-Pixaroma
ComfyUI Pixaromaは、Stable DiffusionのWeb UIであるComfyUIのワークフローを、プロフェッショナルグレードのクリエ…
★ 156 ⑂ 10 MIT 2026-05-11
ComfyUI GitHub ComfyUI-CorridorKey
ComfyUI-CorridorKeyは、ComfyUIユーザー向けにCorridorKeyのネイティブ推論ノードを提供するカスタムノードパッケー…
★ 43 ⑂ 3 NOASSERTION 2026-03-02
最近人気
1か月以内の stars 順
ComfyUI GitHub UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 27 ⑂ 2 GPL-3.0 2026-05-11
ComfyUI GitHub comfyui-aeon-spark
このツールは、NVIDIA DGX Spark (GB10 / Blackwell / sm_121a) に特化して最適化された、最先端のComfyUIディストリ…
★ 26 ⑂ 6 2026-05-04
ComfyUI GitHub ComfyUI-Subworkflow
ComfyUI-Subworkflowは、ComfyUIの既存ワークフローを再利用可能な「サブワークフロー」として活用するための拡張機…
★ 8 ⑂ 2 GPL-3.0 2026-04-28
ComfyUI GitHub VisualBrowserNodes-by-LX
LXによるCivitaiビジュアルブラウザノードは、ComfyUIユーザーがローカルのLoRA、チェックポイント、拡散モデルを効…
★ 2 ⑂ 1 2026-05-11
新着
新しい repo を優先
ComfyUI GitHub UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 27 ⑂ 2 GPL-3.0 2026-05-11
ComfyUI GitHub ComfyUI-Orakul-SVP
ComfyUI-Orakul-SVPは、ComfyUIの出力画像を高品質なマスターファイルとしてエクスポートするためのカスタムノードで…
★ 1 MIT 2026-05-03
ComfyUI GitHub comfyui-aeon-spark
このツールは、NVIDIA DGX Spark (GB10 / Blackwell / sm_121a) に特化して最適化された、最先端のComfyUIディストリ…
★ 26 ⑂ 6 2026-05-04
ComfyUI GitHub VisualBrowserNodes-by-LX
LXによるCivitaiビジュアルブラウザノードは、ComfyUIユーザーがローカルのLoRA、チェックポイント、拡散モデルを効…
★ 2 ⑂ 1 2026-05-11
定番
全期間の stars 順
AIエージェント GitHub langflow
Langflowは、AIエージェントやワークフローを構築・デプロイするための強力なプラットフォームです。視覚的なビルダ…
★ 148.0k ⑂ 9.0k MIT 2026-05-13
AIエージェント GitHub learn-claude-code
このリポジトリは、LLMエージェントを動かすための「ハーネス」(実行環境)構築に特化しています。エージェンシー(…
★ 60.1k ⑂ 9.8k MIT 2026-05-11
AIエージェント GitHub ruflo
Rufloは、AnthropicのClaude Code向けに設計された最先端のマルチエージェントAIオーケストレーションプラットフォー…
★ 49.9k ⑂ 5.6k MIT 2026-05-12
AIエージェント GitHub career-ops
このCareer-Opsは、AIを活用した求職システムであり、特にAIコーディングCLI(Claude Code、Gemini CLIなど)を求職…
★ 44.1k ⑂ 9.3k MIT 2026-05-10
人気
3か月以内の stars 順
AIエージェント GitHub career-ops
このCareer-Opsは、AIを活用した求職システムであり、特にAIコーディングCLI(Claude Code、Gemini CLIなど)を求職…
★ 44.1k ⑂ 9.3k MIT 2026-05-10
AIエージェント GitHub openclaude
OpenClaudeは、クラウドおよびローカルのAIモデルプロバイダーを統合するオープンソースのコーディングエージェントC…
★ 26.4k ⑂ 8.4k NOASSERTION 2026-05-11
AIエージェント
GitHub cli
Google Workspace CLI(gws)は、Google Drive、Gmail、Calendarなど、Google WorkspaceのあらゆるAPIをコマンドライ…
★ 26.1k ⑂ 1.4k Apache-2.0 2026-05-12
AIエージェント
GitHub OpenCLI
OpenCLIは、ウェブサイト、ブラウザセッション、Electronアプリ、およびローカルツールを、人間やAIエージェントにと…
★ 20.4k ⑂ 2.1k Apache-2.0 2026-05-12
最近人気
1か月以内の stars 順
AIエージェント GitHub terax-ai
Teraxは、Tauri 2、Rust、React 19で構築された、軽量(7MB)かつ高速なオープンソースのAIネイティブターミナルエミ…
★ 2.2k ⑂ 220 Apache-2.0 2026-05-11
LLM GitHub skills-manage
`skills-manage`は、Claude Code、Cursor、Gemini CLIなど、20以上のAIコーディングエージェントプラットフォームに…
★ 1.8k ⑂ 166 Apache-2.0 2026-05-02
LLM
GitHub harmonist
Harmonistは、AIエージェントのオーケストレーションと、機械的なプロトコル強制を実現するフレームワークです。Curs…
★ 1.6k ⑂ 318 MIT 2026-04-23
AIエージェント
GitHub DeepSeek-Reasonix
DeepSeek-Reasonixは、ターミナルで動作するDeepSeekネイティブのAIコーディングエージェントです。prefix-cacheの安…
★ 1.3k ⑂ 82 MIT 2026-05-12
新着
新しい repo を優先
AIエージェント GitHub cord
Cordは、LLM、MCPサーバー、HTTPバックエンド、AIエージェントなどを相互接続する分散型ファブリックです。自然言語…
★ 5 ⑂ 1 Apache-2.0 2026-05-12
AIエージェント
GitHub natureco-cli
NatureCo CLIは、ターミナルネイティブで動作する強力なAIエージェントCLIツールです。AIとのチャットを通じて、ワー…
★ 1 ⑂ 1 2026-05-12
AIエージェント
GitHub goalkeeper
goalkeeperは、Claude Codeのための契約駆動型で耐久性のある目標実行ツールです。明確な達成基準(Definition of Do…
★ 6 ⑂ 1 MIT 2026-05-12
AIエージェント
GitHub praxia
Praxiaは、個人の暗黙知を組織の共有ノウハウへと自動昇格させることに特化した、ワークフロー指向のマルチエージェ…
★ 2 Apache-2.0 2026-05-12
定番
全期間の stars 順 LLM
GitHub AutoGPT
AutoGPTは、継続実行型のAIエージェントを構築・配備・運用できるプラットフォームです。低コードのAgent Builderで…
★ 184.2k ⑂ 46.2k NOASSERTION 2026-05-12
LLM GitHub everything-claude-code
Everything Claude Codeは、Claude CodeやCodex、Cursor、OpenCode、Geminiなど複数のAIエージェント実行環境を強化…
★ 179.7k ⑂ 27.7k MIT 2026-05-12
LLM GitHub ollama
Ollamaは、GemmaやQwenなどのオープンモデルをローカル環境で手早く実行・管理できるツールです。macOS/Windows/Linu…
★ 171.2k ⑂ 16.1k MIT 2026-05-12
LLM GitHub prompts.chat
prompts.chatは、ChatGPTをはじめClaude、Gemini、Llama、Mistralなど複数のAIチャットモデルで使えるプロンプトを集…
★ 162.1k ⑂ 21.1k NOASSERTION 2026-05-11
人気
3か月以内の stars 順
LLM GitHub caveman
cavemanは、Claude CodeやCodex、GeminiといったLLMエージェントの出力トークンを最大75%削減し、応答速度を約3倍に…
★ 58.4k ⑂ 3.2k MIT 2026-05-10
LLM GitHub mempalace
MemPalaceは、AIとの会話履歴を逐語的に保存し、セマンティック検索で高速かつ高精度に取得できるローカルファースト…
★ 52.0k ⑂ 6.8k MIT 2026-05-11
LLM
GitHub graphify
Graphifyは、AIコーディングアシスタント向けの革新的なスキルです。任意のコードフォルダー(コード、SQLスキーマ、…
★ 47.3k ⑂ 5.1k MIT 2026-05-12
LLM GitHub llmfit
llmfitは、数多くのLLMモデルとプロバイダーの中から、ユーザーのハードウェア(RAM、CPU、GPU)に最適なものを推奨…
★ 25.9k ⑂ 1.6k MIT 2026-05-13
最近人気
1か月以内の stars 順
LLM GitHub garden-skills
Garden Skillsは、Claude Code、Cursor、CodexなどのAIコーディングエージェント向けに、Webデザイン、知識検索、画…
★ 4.5k ⑂ 648 MIT 2026-05-12
LLM GitHub mercury-agent
Mercuryは、許可制ツール、トークン予算、マルチチャネルアクセスを備えた、"Soul-driven"なAIエージェントです。重…
★ 2.1k ⑂ 218 MIT 2026-05-10
AIエージェント GitHub agent-rules-books
このリポジトリは、リファクタリング、アーキテクチャ、DDD、コード品質に関する古典的なソフトウェア工学の書籍から…
★ 1.3k ⑂ 187 MIT 2026-05-10
LLM GitHub openless
OpenLessは、macOSおよびWindows向けのオープンソース音声入力アプリケーションです。ホットキーを押して話すだけで…
★ 1.2k ⑂ 97 MIT 2026-05-12
新着
新しい repo を優先 LLM
GitHub GenAI-PDF-QA-Assistant
このGenAI PDF Q&Aアシスタントは、Streamlit、LangChain、FAISS、OllamaローカルLLMを活用したAI駆動型ツールです。…
★ 1 2026-05-13
LLM
GitHub dsm
DSM(Dynamic Segmented Memory)は、LLMのコンテキスト管理と連想推論を革新する高性能な記憶エンジンです。本ツー…
★ 4 MIT 2026-05-12
LLM
GitHub ChipMATE
ChipMATEは、RTLコード生成のためのマルチエージェント推論フレームワークです。Verilog生成エージェントとPython参…
★ 1 NOASSERTION 2026-05-12
LLM
GitHub scrape-website-mcp
scrape-website-mcpは、ウェブサイトを高性能にスクレイピングし、クリーンなMarkdown形式でコンテンツを抽出するセ…
★ 1 MIT 2026-05-12
定番
全期間の stars 順
マルチモーダル GitHub anything-llm
AnythingLLMは、ドキュメントとのチャットやAIエージェントの利用を可能にするオールインワンのAI生産性向上ツールで…
★ 59.9k ⑂ 6.5k MIT 2026-05-12
マルチモーダル GitHub LLaVA
LLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ…
★ 24.8k ⑂ 2.8k Apache-2.0 2024-08-12
マルチモーダル
HF gemma-4-31B-it
Gemma 4 31B itは、Google DeepMindのオープンウェイトな命令調整済みマルチモーダルモデルです。テキストと画像を入…
❤ 2.6k ↓ 9.1M apache-2.0 2026-05-07
マルチモーダル
HF clip-vit-large-patch14
CLIPのViT-L/14版を提供する研究向け画像・テキスト理解モデルです。画像と自然言語の対応を同一空間で学習し、事前…
❤ 2.0k ↓ 28.3M 2023-09-15
人気
3か月以内の stars 順 マルチモーダル
HF gemma-4-31B-it
Gemma 4 31B itは、Google DeepMindのオープンウェイトな命令調整済みマルチモーダルモデルです。テキストと画像を入…
❤ 2.6k ↓ 9.1M apache-2.0 2026-05-07
マルチモーダル GitHub parlor
Parlorは、Gemma 4 E2BとKokoroを搭載し、デバイス上でリアルタイムに動作するマルチモーダルAIです。音声と視覚を理…
★ 1.8k ⑂ 213 Apache-2.0 2026-05-11
マルチモーダル HF Qwen3.6-35B-A3B
Qwen3.6-35B-A3Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダル生成モデル…
❤ 1.7k ↓ 3.9M apache-2.0 2026-04-24
マルチモーダル HF Gemma-4-31B-JANG_4M-CRACK
Gemma 4 31BベースのMLX向けマルチモーダル言語モデルで、画像入力を含む対話やコード生成、一般用途のアシスタント…
❤ 1.5k ↓ 124.0k gemma 2026-04-25
最近人気
1か月以内の stars 順
マルチモーダル HF Qwen3.6-35B-A3B
Qwen3.6-35B-A3Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダル生成モデル…
❤ 1.7k ↓ 3.9M apache-2.0 2026-04-24
マルチモーダル HF Kimi-K2.6
Kimi K2.6は、Moonshot AIが公開するネイティブマルチモーダル対応のオープンソース大規模モデルです。長い手順を要…
❤ 1.3k ↓ 1.4M other 2026-05-11
マルチモーダル HF Qwen3.6-27B
Qwen3.6-27Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダルモデルです。画…
❤ 1.2k ↓ 2.4M apache-2.0 2026-04-24
マルチモーダル HF Qwen3.6-35B-A3B-GGUF
Qwen3.6-35B-A3B-GGUFは、Unslothが提供するQwen3.6系の量子化モデル配布で、コーディング支援やツール呼び出し、画…
❤ 996 ↓ 2.7M apache-2.0 2026-04-20
新着
新しい repo を優先
マルチモーダル GitHub multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 1 MIT 2026-05-13
マルチモーダル GitHub vlm-from-scratch
このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…
★ 1 MIT 2026-05-13
マルチモーダル
GitHub Crucible
Crucibleは、ロボットのデモンストレーションデータを評価・キュレーションするための多軸VLM(Vision-Language Mode…
★ 2 MIT 2026-05-10
マルチモーダル HF Qwopus3.6-35B-A3B-v1-GGUF
Qwopus3.6-35B-A3B-v1-GGUFは、Qwen3.6-35B-A3BをベースにLoRAで推論能力を強化した実験的なGGUF形式モデルです。35B…
❤ 111 ↓ 67.2k apache-2.0 2026-05-07
定番
全期間の stars 順
TTS / 音声 GitHub unsloth
Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…
★ 64.0k ⑂ 5.6k Apache-2.0 2026-05-12
TTS / 音声
GitHub Real-Time-Voice-Cloning
このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TT…
★ 59.7k ⑂ 9.4k NOASSERTION 2026-03-09
TTS / 音声
GitHub GPT-SoVITS
GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-s…
★ 57.4k ⑂ 6.3k MIT 2026-04-30
TTS / 音声 HF Kokoro-82M
Kokoroは8200万パラメータを持つオープンウェイトのテキスト読み上げ(TTS)モデルです。軽量なアーキテクチャながら…
❤ 6.1k ↓ 9.7M apache-2.0 2025-04-10
人気
3か月以内の stars 順
TTS / 音声 GitHub MOSS-TTS-Nano
MOSS-TTS-Nanoは、MOSI.AIとOpenMOSSチームが開発したオープンソースの多言語対応小型音声生成モデルです。わずか0.1…
★ 2.9k ⑂ 375 Apache-2.0 2026-05-12
TTS / 音声 GitHub RCLI
RCLIは、macOS上で完全にローカルに動作する音声AIアシスタントツールです。STT、LLM、TTS、VLMの各機能をApple Sili…
★ 1.5k ⑂ 80 MIT 2026-03-16
TTS / 音声 GitHub my-translator
「My Translator」は、macOSおよびWindowsに対応したリアルタイム音声翻訳デスクトップアプリケーションです。システ…
★ 1.1k ⑂ 354 MIT 2026-05-09
TTS / 音声 HF OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 853 ↓ 2.2M apache-2.0 2026-05-07
最近人気
1か月以内の stars 順
TTS / 音声 HF supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 96 ↓ 1.8k openrail 2026-05-06
新着
新しい repo を優先
TTS / 音声 HF supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 96 ↓ 1.8k openrail 2026-05-06
TTS / 音声 GitHub MOSS-TTS-Nano
MOSS-TTS-Nanoは、MOSI.AIとOpenMOSSチームが開発したオープンソースの多言語対応小型音声生成モデルです。わずか0.1…
★ 2.9k ⑂ 375 Apache-2.0 2026-05-12
TTS / 音声 HF OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 853 ↓ 2.2M apache-2.0 2026-05-07
TTS / 音声
GitHub CloneTTS
CloneTTSは、Androidデバイス上で動作する軽量でオフライン対応のテキスト読み上げ(TTS)エンジンです。1〜3秒の音…
★ 618 ⑂ 20 2026-04-28
定番
全期間の stars 順 音楽・音声生成
GitHub Amphion
Amphionは、音声、音楽、スピーチ生成のためのオープンソースツールキットです。再現可能な研究を支援し、音声生成分…
★ 9.8k ⑂ 812 MIT 2026-03-25
音楽・音声生成 GitHub awesome-ai-voice
このリポジトリは、オープンソースのText-to-Speech(TTS)、音声クローン、音楽生成モデルを厳選してまとめたリスト…
★ 259 ⑂ 39 MIT 2026-04-17
音楽・音声生成 GitHub ACE-Step-Studio
ACE-Step Studioは、AIを駆使してフルソング、ボーカル、歌詞、カバー、リミックス、ミュージックビデオなどを生成で…
★ 156 ⑂ 14 MIT 2026-05-06
音楽・音声生成
GitHub Qwen3-TTS-EasyFinetuning
「Qwen3-TTS Easy Finetuning」は、Qwen3-TTSモデルのファインチューニングを簡素化し、高速かつ高品質な音声クロー…
★ 81 ⑂ 14 Apache-2.0 2026-04-08
人気
3か月以内の stars 順
音楽・音声生成 GitHub awesome-ai-voice
このリポジトリは、オープンソースのText-to-Speech(TTS)、音声クローン、音楽生成モデルを厳選してまとめたリスト…
★ 259 ⑂ 39 MIT 2026-04-17
音楽・音声生成 GitHub ACE-Step-Studio
ACE-Step Studioは、AIを駆使してフルソング、ボーカル、歌詞、カバー、リミックス、ミュージックビデオなどを生成で…
★ 156 ⑂ 14 MIT 2026-05-06
音楽・音声生成
GitHub Qwen3-TTS-EasyFinetuning
「Qwen3-TTS Easy Finetuning」は、Qwen3-TTSモデルのファインチューニングを簡素化し、高速かつ高品質な音声クロー…
★ 81 ⑂ 14 Apache-2.0 2026-04-08
音楽・音声生成 GitHub controlfoley
ControlFoleyは、ビデオ、テキスト、参照オーディオを組み合わせることで、高精度かつ制御可能なビデオ-オーディオ生…
★ 81 ⑂ 2 Apache-2.0 2026-04-22
最近人気
1か月以内の stars 順
音楽・音声生成 GitHub controlfoley
ControlFoleyは、ビデオ、テキスト、参照オーディオを組み合わせることで、高精度かつ制御可能なビデオ-オーディオ生…
★ 81 ⑂ 2 Apache-2.0 2026-04-22
音楽・音声生成
GitHub genblaze
Genblazeは、生成AIによるビデオ、画像、オーディオのメディアパイプラインを構築・オーケストレーションするためのP…
★ 10 MIT 2026-05-11
音楽・音声生成
HF mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 5 ↓ 177 mit 2026-05-01
音楽・音声生成
GitHub ACE-Step-Studio-pinokio
「ACE-Step Studio — Pinokio launcher」は、ローカルでAI音楽生成を可能にする「ACE-Step Studio」のワンクリックク…
★ 5 ⑂ 3 MIT 2026-05-06
新着
新しい repo を優先 音楽・音声生成
GitHub vibe-sing
Vibe-singは、Claude Codeセッションの終わりに、そのセッションのトランスクリプトからユーザーの気分を読み取り、…
★ 3 MIT 2026-05-11
音楽・音声生成
GitHub studiomi300
studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…
★ 5 ⑂ 1 MIT 2026-05-12
音楽・音声生成 GitHub aeon-music-maker
aeon-music-makerは、AEON Media Productionファミリーの一部であるスタンドアロンの音楽生成ツールです。ACE Step 1…
★ 5 ⑂ 2 MIT 2026-05-01
音楽・音声生成 GitHub Stable-Audio-Insight
Stable Audio Insightは、Stability AIの「Stable Audio Open 1.0」を基盤としたWindows向けのローカルオーディオ生…
★ 3 NOASSERTION 2026-04-30
定番
全期間の stars 順
ASR / 音声認識 GitHub whisper.cpp
whisper.cppは、OpenAIの高性能な音声認識モデルWhisperをC/C++で軽量に実装したライブラリです。依存関係を最小限に…
★ 49.6k ⑂ 5.5k MIT 2026-05-11
ASR / 音声認識 GitHub voicebox
Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。数秒の音声サンプルから…
★ 25.3k ⑂ 3.1k MIT 2026-04-26
ASR / 音声認識 GitHub llamafile
llamafileは、大規模言語モデル(LLM)を単一の実行可能ファイルとして配布・実行できる革新的なツールです。llama.c…
★ 24.4k ⑂ 1.4k NOASSERTION 2026-05-04
ASR / 音声認識
HF whisper-large-v3
Whisper large-v3は、OpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルです。500万時間以上の学習…
❤ 5.7k ↓ 4.9M apache-2.0 2024-08-12
人気
3か月以内の stars 順
ASR / 音声認識 GitHub OmniVoice-Studio
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。リアルタイムディクテーション、3秒の音声クリップ…
★ 512 ⑂ 40 NOASSERTION 2026-05-11
マルチモーダル HF VibeVoice-ASR-HF
VibeVoice-ASR-HFは、Microsoftの長時間音声向け音声認識モデルをTransformers互換で使えるようにしたツールです。最…
❤ 127 ↓ 295.2k mit 2026-03-09
ASR / 音声認識
GitHub handy-companion
macOS向けの「handy-companion」は、無料のオフライン音声認識アプリ「Handy」で生成された文字起こしテキストを、大…
★ 4 MIT 2026-05-12
最近人気
1か月以内の stars 順 ASR / 音声認識
GitHub handy-companion
macOS向けの「handy-companion」は、無料のオフライン音声認識アプリ「Handy」で生成された文字起こしテキストを、大…
★ 4 MIT 2026-05-12
新着
新しい repo を優先 ASR / 音声認識
GitHub handy-companion
macOS向けの「handy-companion」は、無料のオフライン音声認識アプリ「Handy」で生成された文字起こしテキストを、大…
★ 4 MIT 2026-05-12
ASR / 音声認識 GitHub OmniVoice-Studio
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。リアルタイムディクテーション、3秒の音声クリップ…
★ 512 ⑂ 40 NOASSERTION 2026-05-11
マルチモーダル HF VibeVoice-ASR-HF
VibeVoice-ASR-HFは、Microsoftの長時間音声向け音声認識モデルをTransformers互換で使えるようにしたツールです。最…
❤ 127 ↓ 295.2k mit 2026-03-09
ASR / 音声認識 GitHub typewhisper-mac
TypeWhisper for Macは、macOSユーザー向けの高性能なローカル音声認識およびAIテキスト処理ツールです。WhisperKit…
★ 1.1k ⑂ 72 GPL-3.0 2026-05-12
定番
全期間の stars 順
3D / NeRF GitHub instant-ngp
「NVlabs/instant-ngp」は、ニューラル放射輝度フィールド(NeRF)や符号付き距離関数(SDF)などを雷のように高速に…
★ 17.4k ⑂ 2.1k NOASSERTION 2026-02-02
3D / NeRF GitHub engine
PlayCanvas Engineは、WebGL2とWebGPUをベースにしたオープンソースのゲームエンジンです。Webブラウザ上で動作する…
★ 15.7k ⑂ 1.9k MIT 2026-05-11
3D / NeRF GitHub Meshroom
Meshroomは、複雑なデータ処理パイプラインを作成、管理、実行するためのオープンソースのノードベースのビジュアル…
★ 12.7k ⑂ 1.2k NOASSERTION 2026-05-12
AIエージェント
GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.4k ⑂ 283 MIT 2026-05-11
人気
3か月以内の stars 順 AIエージェント
GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.4k ⑂ 283 MIT 2026-05-11
3D / NeRF GitHub Scal3R
Scal3Rは、CVPR 2026のHighlight論文として発表された、大規模な3D再構築のためのスケーラブルなテスト時学習手法で…
★ 444 ⑂ 35 NOASSERTION 2026-05-11
3D / NeRF GitHub ml-sharp-web
「ml-sharp-web」は、AppleのSHARPモデルを基盤としたブラウザベースのGaussian Splatジェネレーターです。ユーザー…
★ 262 ⑂ 6 2026-05-03
3D / NeRF GitHub video_to_world
本ツール「World Reconstruction From Inconsistent Views」は、ビデオ拡散モデルから3Dの世界を再構築する革新的な…
★ 246 ⑂ 22 MIT 2026-04-27
最近人気
1か月以内の stars 順 AIエージェント
GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.4k ⑂ 283 MIT 2026-05-11
3D / NeRF
GitHub TokenGS
TokenGSは、自己教師ありレンダリング目的で3Dガウスを予測する革新的なツールです。学習可能なガウストークンをエン…
★ 161 ⑂ 3 Apache-2.0 2026-04-20
3D / NeRF GitHub habitat-gs
Habitat-GSは、Facebook ResearchのHabitat-Simを基盤とした、高忠実度ナビゲーションシミュレーターです。3D Gaussi…
★ 124 ⑂ 6 MIT 2026-05-10
3D / NeRF GitHub 3DGS-PLY-3DTiles-Converter
「3DGS-PLY-3DTiles-Converter」は、Gaussian SplattingのPLYファイルを効率的に3D Tiles形式へ変換するNode.jsベー…
★ 74 ⑂ 6 Apache-2.0 2026-05-11
新着
新しい repo を優先 3D / NeRF
GitHub Ghost-Eye
Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU(ピーク時…
★ 1 Apache-2.0 2026-05-10
3D / NeRF GitHub RetrieveVGGT
RetrieveVGGTは、トレーニング不要で長時間のストリーミング3D再構築を可能にする革新的なフレームワークです。VGGT…
★ 3 Apache-2.0 2026-05-12
3D / NeRF
GitHub sam-3d-spark
sam-3d-sparkは、MetaのSAM 3D(BodyおよびObjects)モデルをNVIDIA DGX Spark環境(aarch64/CUDA 13)でローカル実…
★ 1 NOASSERTION 2026-05-03
3D / NeRF
GitHub gaussian_lic_ros2
このツールは、LiDAR-Inertial-Camera Gaussian Splatting SLAMのROS2ネイティブポートであり、Gaussian-LIC/Gaussia…
★ 1 GPL-3.0 2026-05-13
定番
全期間の stars 順
マルチモーダル HF RMBG-1.4
BRIA Background Removal v1.4は、画像内の前景を高精度に切り出して背景を除去できる画像セグメンテーションモデル…
❤ 2.0k ↓ 815.5k other 2025-07-06
マルチモーダル
HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 576 ↓ 992.7k mit 2026-02-04
マルチモーダル
HF segformer_b2_clothes
SegFormer B2をATRベースの人間パースデータセットで衣服セグメンテーション向けに微調整したモデルです。人物画像か…
❤ 499 ↓ 271.8k other 2025-09-19
マルチモーダル HF YOLOv8
Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…
❤ 344 ↓ 6.5k agpl-3.0 2025-01-11
人気
3か月以内の stars 順 LLM
GitHub Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 281 ⑂ 49 Apache-2.0 2026-04-26
最近人気
1か月以内の stars 順 LLM
GitHub Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 281 ⑂ 49 Apache-2.0 2026-04-26
新着
新しい repo を優先 LLM
GitHub Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 281 ⑂ 49 Apache-2.0 2026-04-26
マルチモーダル HF BEN2
BEN2は、画像や動画から人物・物体の前景を高精度に切り抜き、背景除去やマスク生成を行うためのPython向けセグメン…
❤ 232 ↓ 225.5k mit 2025-12-31
マルチモーダル
HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 576 ↓ 992.7k mit 2026-02-04
マルチモーダル HF Anzhcs_YOLOs
Anzhcs_YOLOsは、作者自身や協力者が注釈したデータセットを中心に学習したYOLO系モデル集で、顔・目・頭髪・胸部・…
❤ 170 ↓ 83.9k agpl-3.0 2026-02-25