422 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
表示:
定番
全期間の stars 順
画像生成 GitHub stable-diffusion-webui
Stable Diffusion web UIは、Gradioライブラリで実装された、画像生成AI「Stable Diffusion」の多機能なWebインター…
★ 162.9k ⑂ 30.3k AGPL-3.0 2026-03-02
画像生成 GitHub LocalAI
LocalAIは、大規模言語モデル(LLMs)、視覚、音声、画像、ビデオなど、様々なAIモデルをどんなハードウェア環境でも…
★ 46.2k ⑂ 4.1k MIT 2026-05-12
画像生成 GitHub awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.9k ⑂ 1.4k CC0-1.0 2026-05-11
画像生成 GitHub Hunyuan3D-2
Tencent-Hunyuan/Hunyuan3D-2は、大規模Hunyuan3D拡散モデルを活用した高解像度3Dアセット生成システムです。Hunyuan…
★ 13.7k ⑂ 1.4k NOASSERTION 2025-10-28
人気
3か月以内の stars 順
画像生成 GitHub awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.9k ⑂ 1.4k CC0-1.0 2026-05-11
画像生成 GitHub awesome-gpt-image-2
YouMind-OpenLabが提供する「Awesome GPT Image 2 Prompts」は、OpenAIの次世代画像生成モデル「GPT Image 2」に特化…
★ 5.5k ⑂ 496 NOASSERTION 2026-05-12
AIエージェント GitHub awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 5.0k ⑂ 693 MIT 2026-05-11
画像生成 GitHub gpt_image_2_skill
このツールは、OpenAIのGPT Image 2モデルを用いた画像生成のためのプロンプトギャラリー、画像プロンプトライブラリ…
★ 1.9k ⑂ 181 MIT 2026-05-08
最近人気
1か月以内の stars 順
画像生成 GitHub awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.9k ⑂ 1.4k CC0-1.0 2026-05-11
画像生成 GitHub awesome-gpt-image-2
YouMind-OpenLabが提供する「Awesome GPT Image 2 Prompts」は、OpenAIの次世代画像生成モデル「GPT Image 2」に特化…
★ 5.5k ⑂ 496 NOASSERTION 2026-05-12
AIエージェント GitHub awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 5.0k ⑂ 693 MIT 2026-05-11
画像生成 GitHub gpt_image_2_skill
このツールは、OpenAIのGPT Image 2モデルを用いた画像生成のためのプロンプトギャラリー、画像プロンプトライブラリ…
★ 1.9k ⑂ 181 MIT 2026-05-08
新着
新しい repo を優先
画像生成 GitHub CDM
本ツールは、「Continuous-Time Distribution Matching (CDM)」技術を用いた、少ステップ拡散蒸留のためのフレームワ…
★ 111 ⑂ 4 MIT 2026-05-11
画像生成 GitHub LeapAlign_Code
LeapAlignは、フローマッチングモデルを人間の好みに合わせて微調整するための学習後手法です。完全なサンプリング軌…
★ 25 ⑂ 1 Apache-2.0 2026-05-11
画像生成 GitHub image-prompt-library
Image Prompt Libraryは、生成AIで作成された画像とそのプロンプトをローカルで一元管理するための視覚的ライブラリ…
★ 103 ⑂ 13 AGPL-3.0 2026-05-06
画像生成 HF Z-Anime
Z-Animeは、AlibabaのZ-Image Baseを土台にしたアニメ画像生成向けのフルファインチューニングモデル群です。LoRAマ…
❤ 308 ↓ 9.5k apache-2.0 2026-04-27
定番
全期間の stars 順
動画生成 GitHub LivePortrait
LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…
★ 18.3k ⑂ 1.9k NOASSERTION 2026-03-02
動画生成
GitHub Open-Generative-AI
Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…
★ 12.9k ⑂ 2.3k 2026-05-11
動画生成 GitHub CogVideo
「zai-org/CogVideo」は、テキストや画像から動画を生成する最先端のツールです。CogVideoXシリーズは、テキストから…
★ 12.7k ⑂ 1.3k Apache-2.0 2025-11-04
画像生成 GitHub OpenMontage
OpenMontageは、世界初となるオープンソースのエージェント型動画制作システムです。AIコーディングアシスタントを本…
★ 3.6k ⑂ 728 AGPL-3.0 2026-05-07
人気
3か月以内の stars 順
画像生成 GitHub OpenMontage
OpenMontageは、世界初となるオープンソースのエージェント型動画制作システムです。AIコーディングアシスタントを本…
★ 3.6k ⑂ 728 AGPL-3.0 2026-05-07
動画生成 HF LTX-2.3
LTX-2.3は、Lightricksが公開する音声と映像を同時生成できるDiTベースのオープンウェイト基盤モデルです。画像から…
❤ 1.2k ↓ 1.7M other 2026-04-13
動画生成
HF Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 644 ↓ 157.6k 2026-05-08
画像生成 GitHub nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 408 ⑂ 22 MIT 2026-05-05
最近人気
1か月以内の stars 順 動画生成
HF Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 644 ↓ 157.6k 2026-05-08
画像生成 GitHub nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 408 ⑂ 22 MIT 2026-05-05
動画生成
HF LTX2.3-10Eros
10 Erosは、LTX系のimage-to-video向けに調整されたモデル/チェックポイントで、ComfyUIワークフローや専用ノードと…
❤ 223 ↓ 64.0k 2026-05-11
動画生成 HF Motif-Video-2B
Motif-Video 2Bは、Motif Technologiesが公開した2Bパラメータの動画生成モデルで、1つの重みでテキストから動画生成…
❤ 108 ↓ 4.1k apache-2.0 2026-05-06
新着
新しい repo を優先 動画生成
HF Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 644 ↓ 157.6k 2026-05-08
画像生成 GitHub nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 408 ⑂ 22 MIT 2026-05-05
動画生成
HF LTX2.3-10Eros
10 Erosは、LTX系のimage-to-video向けに調整されたモデル/チェックポイントで、ComfyUIワークフローや専用ノードと…
❤ 223 ↓ 64.0k 2026-05-11
動画生成 HF Motif-Video-2B
Motif-Video 2Bは、Motif Technologiesが公開した2Bパラメータの動画生成モデルで、1つの重みでテキストから動画生成…
❤ 108 ↓ 4.1k apache-2.0 2026-05-06
定番
全期間の stars 順
ComfyUI GitHub ComfyUI
ComfyUIは、画像、ビデオ、3Dモデル、オーディオなどのコンテンツをAIで生成するための強力かつモジュール式のエンジ…
★ 112.5k ⑂ 13.1k GPL-3.0 2026-05-11
ComfyUI GitHub ComfyUI-GGUF
ComfyUI-GGUFは、ComfyUIでGGUF形式の量子化モデルを扱えるようにするカスタムノード集です。特にFLUXやStable Diffu…
★ 3.6k ⑂ 299 Apache-2.0 2026-01-12
ComfyUI GitHub ComfyUI-SeedVR2_VideoUpscaler
ComfyUI-SeedVR2_VideoUpscalerは、高品質なビデオと画像のアップスケーリングを可能にするComfyUI向けの公式SeedVR2…
★ 2.4k ⑂ 181 Apache-2.0 2025-12-24
ComfyUI GitHub ComfyUI-to-Python-Extension
ComfyUIで作成したノードベースのワークフローを、そのまま実行可能なPythonスクリプトへ変換できる拡張ツールです。…
★ 2.3k ⑂ 208 MIT 2026-05-10
人気
3か月以内の stars 順
ComfyUI GitHub locally-uncensored
「Locally Uncensored」は、テキスト、画像、動画の生成をすべてローカル環境で実行できるデスクトップAIアプリケー…
★ 414 ⑂ 55 NOASSERTION 2026-05-11
ComfyUI GitHub ComfyUI-OmniVoice-TTS
ComfyUI-OmniVoice-TTSは、画像生成AIのComfyUI向けに開発された、ゼロショット多言語テキスト読み上げ(TTS)ノード…
★ 372 ⑂ 52 Apache-2.0 2026-05-01
ComfyUI GitHub ComfyUI-Pixaroma
ComfyUI Pixaromaは、Stable DiffusionのWeb UIであるComfyUIのワークフローを、プロフェッショナルグレードのクリエ…
★ 156 ⑂ 10 MIT 2026-05-11
ComfyUI GitHub ComfyUI-CorridorKey
ComfyUI-CorridorKeyは、ComfyUIユーザー向けにCorridorKeyのネイティブ推論ノードを提供するカスタムノードパッケー…
★ 43 ⑂ 3 NOASSERTION 2026-03-02
最近人気
1か月以内の stars 順
ComfyUI GitHub UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 27 ⑂ 2 GPL-3.0 2026-05-11
ComfyUI GitHub comfyui-aeon-spark
このツールは、NVIDIA DGX Spark (GB10 / Blackwell / sm_121a) に特化して最適化された、最先端のComfyUIディストリ…
★ 26 ⑂ 6 2026-05-04
ComfyUI GitHub ComfyUI-Subworkflow
ComfyUI-Subworkflowは、ComfyUIの既存ワークフローを再利用可能な「サブワークフロー」として活用するための拡張機…
★ 8 ⑂ 2 GPL-3.0 2026-04-28
ComfyUI GitHub ComfyUI-Drawer
ComfyUI-Drawerは、ComfyUIの複雑なワークフローをモバイルフレンドリーなモジュール式UIプラットフォームに変革しま…
★ 4 ⑂ 2 NOASSERTION 2026-05-12
新着
新しい repo を優先
ComfyUI GitHub UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 27 ⑂ 2 GPL-3.0 2026-05-11
ComfyUI GitHub comfyui-aeon-spark
このツールは、NVIDIA DGX Spark (GB10 / Blackwell / sm_121a) に特化して最適化された、最先端のComfyUIディストリ…
★ 26 ⑂ 6 2026-05-04
ComfyUI GitHub ComfyUI-Subworkflow
ComfyUI-Subworkflowは、ComfyUIの既存ワークフローを再利用可能な「サブワークフロー」として活用するための拡張機…
★ 8 ⑂ 2 GPL-3.0 2026-04-28
ComfyUI GitHub ComfyUI-Drawer
ComfyUI-Drawerは、ComfyUIの複雑なワークフローをモバイルフレンドリーなモジュール式UIプラットフォームに変革しま…
★ 4 ⑂ 2 NOASSERTION 2026-05-12
定番
全期間の stars 順
AIエージェント GitHub career-ops
このCareer-Opsは、AIを活用した求職システムであり、特にAIコーディングCLI(Claude Code、Gemini CLIなど)を求職…
★ 44.1k ⑂ 9.3k MIT 2026-05-10
AIエージェント GitHub openclaude
OpenClaudeは、クラウドおよびローカルのAIモデルプロバイダーを統合するオープンソースのコーディングエージェントC…
★ 26.4k ⑂ 8.4k NOASSERTION 2026-05-11
AIエージェント GitHub edict
Edictは、中国の古代帝国の統治機構「三省六部制」にインスパイアされた、AIマルチエージェントオーケストレーション…
★ 15.7k ⑂ 1.7k MIT 2026-05-06
AIエージェント GitHub react-doctor
React Doctorは、Reactコードの品質を分析し、0から100のヘルススコアと具体的な診断結果を提供するツールです。この…
★ 8.2k ⑂ 263 MIT 2026-05-12
人気
3か月以内の stars 順
AIエージェント GitHub career-ops
このCareer-Opsは、AIを活用した求職システムであり、特にAIコーディングCLI(Claude Code、Gemini CLIなど)を求職…
★ 44.1k ⑂ 9.3k MIT 2026-05-10
AIエージェント GitHub openclaude
OpenClaudeは、クラウドおよびローカルのAIモデルプロバイダーを統合するオープンソースのコーディングエージェントC…
★ 26.4k ⑂ 8.4k NOASSERTION 2026-05-11
AIエージェント GitHub edict
Edictは、中国の古代帝国の統治機構「三省六部制」にインスパイアされた、AIマルチエージェントオーケストレーション…
★ 15.7k ⑂ 1.7k MIT 2026-05-06
AIエージェント GitHub react-doctor
React Doctorは、Reactコードの品質を分析し、0から100のヘルススコアと具体的な診断結果を提供するツールです。この…
★ 8.2k ⑂ 263 MIT 2026-05-12
最近人気
1か月以内の stars 順
AIエージェント GitHub terax-ai
Teraxは、Tauri 2、Rust、React 19で構築された、軽量(7MB)かつ高速なオープンソースのAIネイティブターミナルエミ…
★ 2.2k ⑂ 220 Apache-2.0 2026-05-11
LLM GitHub skills-manage
`skills-manage`は、Claude Code、Cursor、Gemini CLIなど、20以上のAIコーディングエージェントプラットフォームに…
★ 1.8k ⑂ 166 Apache-2.0 2026-05-02
LLM
GitHub harmonist
Harmonistは、AIエージェントのオーケストレーションと、機械的なプロトコル強制を実現するフレームワークです。Curs…
★ 1.6k ⑂ 318 MIT 2026-04-23
AIエージェント
GitHub DeepSeek-Reasonix
DeepSeek-Reasonixは、ターミナルで動作するDeepSeekネイティブのAIコーディングエージェントです。prefix-cacheの安…
★ 1.3k ⑂ 82 MIT 2026-05-12
新着
新しい repo を優先
AIエージェント GitHub cord
Cordは、LLM、MCPサーバー、HTTPバックエンド、AIエージェントなどを相互接続する分散型ファブリックです。自然言語…
★ 5 ⑂ 1 Apache-2.0 2026-05-12
AIエージェント
GitHub natureco-cli
NatureCo CLIは、ターミナルネイティブで動作する強力なAIエージェントCLIツールです。AIとのチャットを通じて、ワー…
★ 1 ⑂ 1 2026-05-12
AIエージェント
GitHub goalkeeper
goalkeeperは、Claude Codeのための契約駆動型で耐久性のある目標実行ツールです。明確な達成基準(Definition of Do…
★ 6 ⑂ 1 MIT 2026-05-12
AIエージェント
GitHub praxia
Praxiaは、個人の暗黙知を組織の共有ノウハウへと自動昇格させることに特化した、ワークフロー指向のマルチエージェ…
★ 2 Apache-2.0 2026-05-12
定番
全期間の stars 順 LLM
GitHub AutoGPT
AutoGPTは、継続実行型のAIエージェントを構築・配備・運用できるプラットフォームです。低コードのAgent Builderで…
★ 184.2k ⑂ 46.2k NOASSERTION 2026-05-12
LLM GitHub everything-claude-code
Everything Claude Codeは、Claude CodeやCodex、Cursor、OpenCode、Geminiなど複数のAIエージェント実行環境を強化…
★ 179.7k ⑂ 27.7k MIT 2026-05-12
LLM GitHub ollama
Ollamaは、GemmaやQwenなどのオープンモデルをローカル環境で手早く実行・管理できるツールです。macOS/Windows/Linu…
★ 171.2k ⑂ 16.1k MIT 2026-05-12
LLM GitHub prompts.chat
prompts.chatは、ChatGPTをはじめClaude、Gemini、Llama、Mistralなど複数のAIチャットモデルで使えるプロンプトを集…
★ 162.1k ⑂ 21.1k NOASSERTION 2026-05-11
人気
3か月以内の stars 順
LLM GitHub caveman
cavemanは、Claude CodeやCodex、GeminiといったLLMエージェントの出力トークンを最大75%削減し、応答速度を約3倍に…
★ 58.4k ⑂ 3.2k MIT 2026-05-10
LLM GitHub mempalace
MemPalaceは、AIとの会話履歴を逐語的に保存し、セマンティック検索で高速かつ高精度に取得できるローカルファースト…
★ 52.0k ⑂ 6.8k MIT 2026-05-11
LLM GitHub QwenPaw
QwenPawは、個人のニーズに合わせてローカルまたはクラウドに容易に導入できるAIアシスタントです。ユーザーはデータ…
★ 16.6k ⑂ 2.4k Apache-2.0 2026-05-12
LLM GitHub hermes-web-ui
「Hermes Web UI」は、AIエージェントである「Hermes Agent」のための高機能なウェブダッシュボードです。このツール…
★ 4.4k ⑂ 548 NOASSERTION 2026-05-12
最近人気
1か月以内の stars 順
LLM GitHub mercury-agent
Mercuryは、許可制ツール、トークン予算、マルチチャネルアクセスを備えた、"Soul-driven"なAIエージェントです。重…
★ 2.1k ⑂ 218 MIT 2026-05-10
AIエージェント GitHub agent-rules-books
このリポジトリは、リファクタリング、アーキテクチャ、DDD、コード品質に関する古典的なソフトウェア工学の書籍から…
★ 1.3k ⑂ 187 MIT 2026-05-10
LLM GitHub openless
OpenLessは、macOSおよびWindows向けのオープンソース音声入力アプリケーションです。ホットキーを押して話すだけで…
★ 1.2k ⑂ 97 MIT 2026-05-12
LLM
GitHub how-to-train-your-gpt
このリポジトリは、現代の大規模言語モデル(LLM)をゼロから構築、訓練、実行する方法を学ぶための12章構成のインタ…
★ 1.0k ⑂ 139 MIT 2026-05-10
新着
新しい repo を優先 LLM
GitHub ChipMATE
ChipMATEは、RTLコード生成のためのマルチエージェント推論フレームワークです。Verilog生成エージェントとPython参…
★ 1 NOASSERTION 2026-05-12
LLM
GitHub scrape-website-mcp
scrape-website-mcpは、ウェブサイトを高性能にスクレイピングし、クリーンなMarkdown形式でコンテンツを抽出するセ…
★ 1 MIT 2026-05-12
LLM
GitHub augmenting_historians
このPythonスクリプト群は、歴史家が自身の原稿を批判的に分析するための実験的なインフラストラクチャです。RAGアー…
★ 1 MIT 2026-05-12
LLM
GitHub A-LLM-learning-lecture
本講義は大言語モデル(LLM)の体系的な学習ノートで、Transformerの基礎からマルチエージェントシステムまで、15週…
★ 2 NOASSERTION 2026-05-09
定番
全期間の stars 順 マルチモーダル
HF gemma-4-31B-it
Gemma 4 31B itは、Google DeepMindのオープンウェイトな命令調整済みマルチモーダルモデルです。テキストと画像を入…
❤ 2.6k ↓ 9.1M apache-2.0 2026-05-07
マルチモーダル
HF clip-vit-large-patch14
CLIPのViT-L/14版を提供する研究向け画像・テキスト理解モデルです。画像と自然言語の対応を同一空間で学習し、事前…
❤ 2.0k ↓ 28.3M 2023-09-15
マルチモーダル
HF sam3
SAM 3は、画像と動画に対してプロンプト可能なセグメンテーションを行う統合基盤モデルです。短いテキスト、点、ボッ…
❤ 2.0k ↓ 3.0M other 2025-11-20
マルチモーダル HF Qwen3.6-35B-A3B
Qwen3.6-35B-A3Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダル生成モデル…
❤ 1.7k ↓ 3.9M apache-2.0 2026-04-24
人気
3か月以内の stars 順 マルチモーダル
HF gemma-4-31B-it
Gemma 4 31B itは、Google DeepMindのオープンウェイトな命令調整済みマルチモーダルモデルです。テキストと画像を入…
❤ 2.6k ↓ 9.1M apache-2.0 2026-05-07
マルチモーダル HF Qwen3.6-35B-A3B
Qwen3.6-35B-A3Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダル生成モデル…
❤ 1.7k ↓ 3.9M apache-2.0 2026-04-24
マルチモーダル HF Gemma-4-31B-JANG_4M-CRACK
Gemma 4 31BベースのMLX向けマルチモーダル言語モデルで、画像入力を含む対話やコード生成、一般用途のアシスタント…
❤ 1.5k ↓ 124.0k gemma 2026-04-25
マルチモーダル HF Kimi-K2.6
Kimi K2.6は、Moonshot AIが公開するネイティブマルチモーダル対応のオープンソース大規模モデルです。長い手順を要…
❤ 1.3k ↓ 1.4M other 2026-05-11
最近人気
1か月以内の stars 順
マルチモーダル HF Qwen3.6-35B-A3B
Qwen3.6-35B-A3Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダル生成モデル…
❤ 1.7k ↓ 3.9M apache-2.0 2026-04-24
マルチモーダル HF Kimi-K2.6
Kimi K2.6は、Moonshot AIが公開するネイティブマルチモーダル対応のオープンソース大規模モデルです。長い手順を要…
❤ 1.3k ↓ 1.4M other 2026-05-11
マルチモーダル HF Qwen3.6-27B
Qwen3.6-27Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダルモデルです。画…
❤ 1.2k ↓ 2.4M apache-2.0 2026-04-24
マルチモーダル HF Qwen3.6-35B-A3B-GGUF
Qwen3.6-35B-A3B-GGUFは、Unslothが提供するQwen3.6系の量子化モデル配布で、コーディング支援やツール呼び出し、画…
❤ 996 ↓ 2.7M apache-2.0 2026-04-20
新着
新しい repo を優先
マルチモーダル HF Qwopus3.6-35B-A3B-v1-GGUF
Qwopus3.6-35B-A3B-v1-GGUFは、Qwen3.6-35B-A3BをベースにLoRAで推論能力を強化した実験的なGGUF形式モデルです。35B…
❤ 111 ↓ 67.2k apache-2.0 2026-05-07
マルチモーダル HF Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF
このREADMEは、Qwen 3.6系をベースに40Bへ拡張し、Deckard系データセットやClaude 4.6 Opus由来データで多段階調整し…
❤ 65 ↓ 107.1k apache-2.0 2026-05-02
マルチモーダル HF Qwen3.5-9B-DeepSeek-V4-Flash-GGUF
Qwen3.5-9Bをベースに、DeepSeek-V4由来の高品質な推論データで蒸留した軽量推論モデルのREADMEです。多段階の論理展…
❤ 131 ↓ 178.2k apache-2.0 2026-05-02
マルチモーダル HF Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF
このREADMEは、Qwen 3.6 27Bをベースに検閲緩和と追加ファインチューニングを施し、さらにGGUF量子化版を多数用意し…
❤ 131 ↓ 197.1k apache-2.0 2026-04-30
定番
全期間の stars 順
TTS / 音声 GitHub unsloth
Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…
★ 64.0k ⑂ 5.6k Apache-2.0 2026-05-12
TTS / 音声
GitHub Real-Time-Voice-Cloning
このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TT…
★ 59.7k ⑂ 9.4k NOASSERTION 2026-03-09
TTS / 音声
GitHub GPT-SoVITS
GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-s…
★ 57.4k ⑂ 6.3k MIT 2026-04-30
TTS / 音声 HF Kokoro-82M
Kokoroは8200万パラメータを持つオープンウェイトのテキスト読み上げ(TTS)モデルです。軽量なアーキテクチャながら…
❤ 6.1k ↓ 9.7M apache-2.0 2025-04-10
人気
3か月以内の stars 順
TTS / 音声 HF OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 853 ↓ 2.2M apache-2.0 2026-05-07
TTS / 音声 HF supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 96 ↓ 1.8k openrail 2026-05-06
最近人気
1か月以内の stars 順
TTS / 音声 HF supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 96 ↓ 1.8k openrail 2026-05-06
新着
新しい repo を優先
TTS / 音声 HF supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 96 ↓ 1.8k openrail 2026-05-06
TTS / 音声 HF OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 853 ↓ 2.2M apache-2.0 2026-05-07
TTS / 音声 HF Qwen3-TTS-12Hz-1.7B-CustomVoice
Qwen3-TTSは、テキストを音声に変換する先進的なモデルで、中国語、英語、日本語を含む10の主要言語と複数の方言プロ…
❤ 1.5k ↓ 1.6M apache-2.0 2026-01-29
ComfyUI GitHub ComfyUI-Maya1_TTS
このツールは、ComfyUI上でMaya1(30億パラメータの音声モデル)を利用し、表現豊かな音声生成を可能にするノードパ…
★ 62 ⑂ 11 Apache-2.0 2025-11-11
定番
全期間の stars 順 音楽・音声生成
GitHub Amphion
Amphionは、音声、音楽、スピーチ生成のためのオープンソースツールキットです。再現可能な研究を支援し、音声生成分…
★ 9.8k ⑂ 812 MIT 2026-03-25
音楽・音声生成
HF mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 5 ↓ 177 mit 2026-05-01
人気
3か月以内の stars 順 音楽・音声生成
HF mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 5 ↓ 177 mit 2026-05-01
最近人気
1か月以内の stars 順 音楽・音声生成
HF mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 5 ↓ 177 mit 2026-05-01
新着
新しい repo を優先 音楽・音声生成
HF mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 5 ↓ 177 mit 2026-05-01
音楽・音声生成
GitHub Amphion
Amphionは、音声、音楽、スピーチ生成のためのオープンソースツールキットです。再現可能な研究を支援し、音声生成分…
★ 9.8k ⑂ 812 MIT 2026-03-25
定番
全期間の stars 順
ASR / 音声認識 GitHub whisper.cpp
whisper.cppは、OpenAIの高性能な音声認識モデルWhisperをC/C++で軽量に実装したライブラリです。依存関係を最小限に…
★ 49.6k ⑂ 5.5k MIT 2026-05-11
ASR / 音声認識 GitHub voicebox
Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。数秒の音声サンプルから…
★ 25.3k ⑂ 3.1k MIT 2026-04-26
ASR / 音声認識 GitHub llamafile
llamafileは、大規模言語モデル(LLM)を単一の実行可能ファイルとして配布・実行できる革新的なツールです。llama.c…
★ 24.4k ⑂ 1.4k NOASSERTION 2026-05-04
ASR / 音声認識
HF whisper-large-v3
Whisper large-v3は、OpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルです。500万時間以上の学習…
❤ 5.7k ↓ 4.9M apache-2.0 2024-08-12
人気
3か月以内の stars 順
マルチモーダル HF VibeVoice-ASR-HF
VibeVoice-ASR-HFは、Microsoftの長時間音声向け音声認識モデルをTransformers互換で使えるようにしたツールです。最…
❤ 127 ↓ 295.2k mit 2026-03-09
最近人気
1か月以内の stars 順該当する記事がまだありません。
新着
新しい repo を優先
マルチモーダル HF VibeVoice-ASR-HF
VibeVoice-ASR-HFは、Microsoftの長時間音声向け音声認識モデルをTransformers互換で使えるようにしたツールです。最…
❤ 127 ↓ 295.2k mit 2026-03-09
ASR / 音声認識 GitHub voicebox
Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。数秒の音声サンプルから…
★ 25.3k ⑂ 3.1k MIT 2026-04-26
マルチモーダル HF Voxtral-Small-24B-2507
Voxtral Small 1.0(24B)は、Mistral Small 3系をベースに音声入力機能を強化した大規模音声理解モデルです。音声の…
❤ 493 ↓ 46.6k apache-2.0 2025-12-20
ASR / 音声認識
HF whisper-large-v3-turbo
Whisper large-v3-turboは、OpenAIが提案する最先端の自動音声認識(ASR)および音声翻訳モデルであるWhisper large-…
❤ 3.0k ↓ 6.9M mit 2024-10-04
定番
全期間の stars 順
3D / NeRF GitHub engine
PlayCanvas Engineは、WebGL2とWebGPUをベースにしたオープンソースのゲームエンジンです。Webブラウザ上で動作する…
★ 15.7k ⑂ 1.9k MIT 2026-05-11
AIエージェント
GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.4k ⑂ 283 MIT 2026-05-11
3D / NeRF HF HY-Motion-1.0
HY-Motion 1.0は、テキスト指示から人型キャラクターの3D骨格モーションを生成できるTencentの大規模Text-to-Motion…
❤ 408 ↓ 451 other 2025-12-31
3D / NeRF HF VoxTell
VoxTellは、自然文のテキスト指示からCT・MRI・PETなどの3D医用画像に対するセグメンテーションマスクを生成できる医…
❤ 15 ↓ 356 cc-by-nc-sa-4.0 2026-03-04
人気
3か月以内の stars 順 AIエージェント
GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.4k ⑂ 283 MIT 2026-05-11
最近人気
1か月以内の stars 順 AIエージェント
GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.4k ⑂ 283 MIT 2026-05-11
新着
新しい repo を優先 AIエージェント
GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.4k ⑂ 283 MIT 2026-05-11
3D / NeRF HF HY-Motion-1.0
HY-Motion 1.0は、テキスト指示から人型キャラクターの3D骨格モーションを生成できるTencentの大規模Text-to-Motion…
❤ 408 ↓ 451 other 2025-12-31
3D / NeRF HF VoxTell
VoxTellは、自然文のテキスト指示からCT・MRI・PETなどの3D医用画像に対するセグメンテーションマスクを生成できる医…
❤ 15 ↓ 356 cc-by-nc-sa-4.0 2026-03-04
3D / NeRF GitHub engine
PlayCanvas Engineは、WebGL2とWebGPUをベースにしたオープンソースのゲームエンジンです。Webブラウザ上で動作する…
★ 15.7k ⑂ 1.9k MIT 2026-05-11
定番
全期間の stars 順
マルチモーダル HF RMBG-1.4
BRIA Background Removal v1.4は、画像内の前景を高精度に切り出して背景を除去できる画像セグメンテーションモデル…
❤ 2.0k ↓ 815.5k other 2025-07-06
マルチモーダル
HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 576 ↓ 992.7k mit 2026-02-04
マルチモーダル
HF segformer_b2_clothes
SegFormer B2をATRベースの人間パースデータセットで衣服セグメンテーション向けに微調整したモデルです。人物画像か…
❤ 499 ↓ 271.8k other 2025-09-19
マルチモーダル HF YOLOv8
Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…
❤ 344 ↓ 6.5k agpl-3.0 2025-01-11
人気
3か月以内の stars 順 LLM
GitHub Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 281 ⑂ 49 Apache-2.0 2026-04-26
最近人気
1か月以内の stars 順 LLM
GitHub Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 281 ⑂ 49 Apache-2.0 2026-04-26
新着
新しい repo を優先 LLM
GitHub Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 281 ⑂ 49 Apache-2.0 2026-04-26
マルチモーダル HF BEN2
BEN2は、画像や動画から人物・物体の前景を高精度に切り抜き、背景除去やマスク生成を行うためのPython向けセグメン…
❤ 232 ↓ 225.5k mit 2025-12-31
マルチモーダル
HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 576 ↓ 992.7k mit 2026-02-04
マルチモーダル HF Anzhcs_YOLOs
Anzhcs_YOLOsは、作者自身や協力者が注釈したデータセットを中心に学習したYOLO系モデル集で、顔・目・頭髪・胸部・…
❤ 170 ↓ 83.9k agpl-3.0 2026-02-25