348 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
表示:
定番
全期間の stars 順
画像生成 GitHub awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.3k ⑂ 1.3k CC0-1.0 2026-05-08
画像生成 HF stable-diffusion-xl-base-1.0
SDXL 1.0 ベースモデルは、テキストプロンプトから画像を生成・変更する拡散ベースのテキスト-to-画像生成モデルです…
❤ 7.7k ↓ 2.1M openrail++ 2023-10-30
画像生成 HF Z-Image-Turbo
Z-Imageは、60億パラメータを持つ高効率な画像生成モデルファミリーです。特にZ-Image-Turboは、わずか8NFEsでサブ秒…
❤ 4.6k ↓ 1.3M apache-2.0 2026-01-30
AIエージェント GitHub awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 4.6k ⑂ 646 MIT 2026-05-08
人気
3か月以内の stars 順
画像生成 GitHub awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.3k ⑂ 1.3k CC0-1.0 2026-05-08
AIエージェント GitHub awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 4.6k ⑂ 646 MIT 2026-05-08
画像生成 GitHub PixelSmile
PixelSmileは、顔の表情を連続的に制御しながら、微調整された編集を可能にするツールです。既存の顔の同一性を強く…
★ 441 ⑂ 22 Apache-2.0 2026-04-22
画像生成 HF Flux2-Klein-9B-Consistency
Flux2-Klein-9B-Consistencyは、black-forest-labs/FLUX.2-klein-9B向けのLoRAで、追加のキーワードなしでもキャラク…
❤ 361 ↓ 30.6k apache-2.0 2026-04-19
最近人気
1か月以内の stars 順
画像生成 GitHub awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.3k ⑂ 1.3k CC0-1.0 2026-05-08
AIエージェント GitHub awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 4.6k ⑂ 646 MIT 2026-05-08
画像生成 HF Z-Anime
Z-Animeは、AlibabaのZ-Image Baseを土台にしたアニメ画像生成向けのフルファインチューニングモデル群です。LoRAマ…
❤ 233 ↓ 5.1k apache-2.0 2026-04-27
画像生成 GitHub Illustrious-NoobAI-Style-Explorer
Illustrious XL & NoobAI-XL Style Explorerは、AIアーティストやプロンプトエンジニア向けに開発された、高性能なイ…
★ 64 ⑂ 10 MIT 2026-04-28
新着
新しい repo を優先
画像生成 HF Z-Anime
Z-Animeは、AlibabaのZ-Image Baseを土台にしたアニメ画像生成向けのフルファインチューニングモデル群です。LoRAマ…
❤ 233 ↓ 5.1k apache-2.0 2026-04-27
AIエージェント GitHub awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 4.6k ⑂ 646 MIT 2026-05-08
画像生成 GitHub awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.3k ⑂ 1.3k CC0-1.0 2026-05-08
画像生成 GitHub Illustrious-NoobAI-Style-Explorer
Illustrious XL & NoobAI-XL Style Explorerは、AIアーティストやプロンプトエンジニア向けに開発された、高性能なイ…
★ 64 ⑂ 10 MIT 2026-04-28
定番
全期間の stars 順
画像生成 GitHub OpenMontage
OpenMontageは、世界初となるオープンソースのエージェント型動画制作システムです。AIコーディングアシスタントを本…
★ 3.5k ⑂ 707 AGPL-3.0 2026-05-07
動画生成 HF HunyuanVideo
HunyuanVideoは、Tencentが公開した大規模な動画生成基盤モデルの実装リポジトリです。PyTorch製のモデル定義、学習…
❤ 2.2k ↓ 1.0k other 2025-03-06
動画生成
HF LTX-2
LTX-2は、Lightricksが公開するDiTベースの音声付き動画生成基盤モデルです。テキストから動画、画像から動画に加え…
❤ 1.7k ↓ 726.3k other 2026-03-02
動画生成 HF Wan2.1-T2V-14B
Wan2.1-T2V-14Bは、テキストから高品質な動画を生成する大規模オープンモデルです。480Pと720Pの両方に対応し、動き…
❤ 1.5k ↓ 37.8k apache-2.0 2025-03-12
人気
3か月以内の stars 順
画像生成 GitHub OpenMontage
OpenMontageは、世界初となるオープンソースのエージェント型動画制作システムです。AIコーディングアシスタントを本…
★ 3.5k ⑂ 707 AGPL-3.0 2026-05-07
動画生成 HF LTX-2.3
LTX-2.3は、Lightricksが公開する音声と映像を同時生成できるDiTベースのオープンウェイト基盤モデルです。画像から…
❤ 1.1k ↓ 1.7M other 2026-04-13
動画生成
HF Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 418 ↓ 93.0k 2026-05-08
画像生成 GitHub nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 391 ⑂ 21 MIT 2026-05-05
最近人気
1か月以内の stars 順 動画生成
HF Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 418 ↓ 93.0k 2026-05-08
画像生成 GitHub nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 391 ⑂ 21 MIT 2026-05-05
動画生成
HF LTX2.3-10Eros
10 Erosは、LTX系のimage-to-video向けに調整されたモデル/チェックポイントで、ComfyUIワークフローや専用ノードと…
❤ 158 ↓ 42.5k 2026-05-07
動画生成 HF Motif-Video-2B
Motif-Video 2Bは、Motif Technologiesが公開した2Bパラメータの動画生成モデルで、1つの重みでテキストから動画生成…
❤ 106 ↓ 3.9k apache-2.0 2026-05-06
新着
新しい repo を優先 動画生成
HF Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 418 ↓ 93.0k 2026-05-08
画像生成 GitHub nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 391 ⑂ 21 MIT 2026-05-05
動画生成
HF LTX2.3-10Eros
10 Erosは、LTX系のimage-to-video向けに調整されたモデル/チェックポイントで、ComfyUIワークフローや専用ノードと…
❤ 158 ↓ 42.5k 2026-05-07
動画生成 HF Motif-Video-2B
Motif-Video 2Bは、Motif Technologiesが公開した2Bパラメータの動画生成モデルで、1つの重みでテキストから動画生成…
❤ 106 ↓ 3.9k apache-2.0 2026-05-06
定番
全期間の stars 順
ComfyUI GitHub ComfyUI-GGUF
ComfyUI-GGUFは、ComfyUIでGGUF形式の量子化モデルを扱えるようにするカスタムノード集です。特にFLUXやStable Diffu…
★ 3.6k ⑂ 298 Apache-2.0 2026-01-12
ComfyUI GitHub ComfyUI-to-Python-Extension
ComfyUIで作成したノードベースのワークフローを、そのまま実行可能なPythonスクリプトへ変換できる拡張ツールです。…
★ 2.3k ⑂ 207 MIT 2026-04-19
ComfyUI GitHub comfyui-mixlab-nodes
comfyui-mixlab-nodesは、ComfyUI向けにWebアプリ化、画面共有、音声認識・音声合成、GPT連携、3D生成などをまとめて…
★ 1.8k ⑂ 121 MIT 2025-07-22
ComfyUI GitHub comfyui-photoshop
「ComfyUI Photoshop Plugin」は、パワフルなAI画像生成ツール「ComfyUI」の機能をAdobe Photoshop内にシームレスに…
★ 1.6k ⑂ 109 NOASSERTION 2026-02-10
人気
3か月以内の stars 順
ComfyUI GitHub ComfyUI-CorridorKey
ComfyUI-CorridorKeyは、ComfyUIユーザー向けにCorridorKeyのネイティブ推論ノードを提供するカスタムノードパッケー…
★ 43 ⑂ 3 NOASSERTION 2026-03-02
ComfyUI GitHub ComfyUI-ConnectTheDots
ComfyUI-ConnectTheDotsは、人気のある画像生成UI「ComfyUI」のための拡張機能です。大規模なワークフローにおいて、…
★ 36 ⑂ 4 MIT 2026-05-02
最近人気
1か月以内の stars 順
ComfyUI GitHub ComfyUI-ConnectTheDots
ComfyUI-ConnectTheDotsは、人気のある画像生成UI「ComfyUI」のための拡張機能です。大規模なワークフローにおいて、…
★ 36 ⑂ 4 MIT 2026-05-02
新着
新しい repo を優先
ComfyUI GitHub ComfyUI-ConnectTheDots
ComfyUI-ConnectTheDotsは、人気のある画像生成UI「ComfyUI」のための拡張機能です。大規模なワークフローにおいて、…
★ 36 ⑂ 4 MIT 2026-05-02
ComfyUI GitHub ComfyUI-CorridorKey
ComfyUI-CorridorKeyは、ComfyUIユーザー向けにCorridorKeyのネイティブ推論ノードを提供するカスタムノードパッケー…
★ 43 ⑂ 3 NOASSERTION 2026-03-02
ComfyUI GitHub ComfyUI-ZImage-Bake-Extract
ComfyUI向けのカスタムノードで、Z-Image系ベースモデルにLoRAを焼き込んで単体モデル化したり、マージ済み・追加学…
★ 3 ⑂ 2 Apache-2.0 2026-02-09
ComfyUI
GitHub ComfyUI_PromptExtractor_nodes
ComfyUI向けのカスタムノード集で、ComfyUIが生成したPNG画像のメタデータからプロンプトを抽出できます。元のワーク…
★ 2 ⑂ 1 MIT 2026-04-07
定番
全期間の stars 順
AIエージェント GitHub CubeSandbox
Cube Sandboxは、AIエージェント向けに設計された高性能で安全なサンドボックスサービスです。RustVMMとKVMに基づい…
★ 5.2k ⑂ 372 NOASSERTION 2026-05-08
ComfyUI GitHub ComfyUI-Copilot
ComfyUI-Copilotは、ComfyUI上で動作するAI搭載のインテリジェントアシスタントです。ワークフローの構築、デバッグ…
★ 5.1k ⑂ 325 MIT 2026-04-07
AIエージェント GitHub agents-cli
agents-cliは、Google Cloud上でAIエージェントを構築、評価、デプロイするためのコマンドラインインターフェース(C…
★ 2.1k ⑂ 249 Apache-2.0 2026-05-06
LLM GitHub skills-manage
`skills-manage`は、Claude Code、Cursor、Gemini CLIなど、20以上のAIコーディングエージェントプラットフォームに…
★ 1.7k ⑂ 152 Apache-2.0 2026-05-02
人気
3か月以内の stars 順
AIエージェント GitHub CubeSandbox
Cube Sandboxは、AIエージェント向けに設計された高性能で安全なサンドボックスサービスです。RustVMMとKVMに基づい…
★ 5.2k ⑂ 372 NOASSERTION 2026-05-08
AIエージェント GitHub agents-cli
agents-cliは、Google Cloud上でAIエージェントを構築、評価、デプロイするためのコマンドラインインターフェース(C…
★ 2.1k ⑂ 249 Apache-2.0 2026-05-06
LLM GitHub skills-manage
`skills-manage`は、Claude Code、Cursor、Gemini CLIなど、20以上のAIコーディングエージェントプラットフォームに…
★ 1.7k ⑂ 152 Apache-2.0 2026-05-02
LLM GitHub hands-on-modern-rl
このプロジェクトは、現代の強化学習を実践的に学ぶためのオープンソースカリキュラム「Hands-On Modern RL」です。…
★ 1.4k ⑂ 69 NOASSERTION 2026-05-08
最近人気
1か月以内の stars 順
AIエージェント GitHub CubeSandbox
Cube Sandboxは、AIエージェント向けに設計された高性能で安全なサンドボックスサービスです。RustVMMとKVMに基づい…
★ 5.2k ⑂ 372 NOASSERTION 2026-05-08
LLM GitHub skills-manage
`skills-manage`は、Claude Code、Cursor、Gemini CLIなど、20以上のAIコーディングエージェントプラットフォームに…
★ 1.7k ⑂ 152 Apache-2.0 2026-05-02
LLM GitHub hands-on-modern-rl
このプロジェクトは、現代の強化学習を実践的に学ぶためのオープンソースカリキュラム「Hands-On Modern RL」です。…
★ 1.4k ⑂ 69 NOASSERTION 2026-05-08
LLM
GitHub harmonist
Harmonistは、AIエージェントのオーケストレーションと、機械的なプロトコル強制を実現するフレームワークです。Curs…
★ 1.4k ⑂ 308 MIT 2026-04-23
新着
新しい repo を優先
AIエージェント GitHub Photo-agents
Photo Agentsは、視覚情報に基づいてPCを操作する自律進化型エージェントです。画面上の情報を認識し、推論し、行動…
★ 184 ⑂ 10 MIT 2026-05-08
LLM GitHub opencode-chrome-annotation
「OpenCode Chrome Annotation」は、Chromeブラウザ上で任意のウェブページに直接注釈を付け、そのスクリーンショッ…
★ 62 ⑂ 3 GPL-3.0 2026-04-30
LLM
GitHub PaperPlotHub
PaperPlotHubは、研究者向けのオープンソースの論文図表共有プラットフォームです。論文で使用された図表とその生成…
★ 57 ⑂ 2 MIT 2026-04-26
LLM GitHub SmallHarness
Small Harnessは、Mac上で小型のオープンウェイトLLMをローカル実行するためのターミナルベースのエージェントハーネ…
★ 82 ⑂ 5 MIT 2026-05-03
定番
全期間の stars 順 LLM
GitHub AutoGPT
AutoGPTは、継続実行型のAIエージェントを構築・配備・運用できるプラットフォームです。低コードのAgent Builderで…
★ 184.1k ⑂ 46.2k NOASSERTION 2026-05-08
LLM GitHub everything-claude-code
Everything Claude Codeは、Claude CodeやCodex、Cursor、OpenCode、Geminiなど複数のAIエージェント実行環境を強化…
★ 175.7k ⑂ 27.2k MIT 2026-05-03
LLM GitHub ollama
Ollamaは、GemmaやQwenなどのオープンモデルをローカル環境で手早く実行・管理できるツールです。macOS/Windows/Linu…
★ 171.0k ⑂ 16.0k MIT 2026-05-08
LLM GitHub prompts.chat
prompts.chatは、ChatGPTをはじめClaude、Gemini、Llama、Mistralなど複数のAIチャットモデルで使えるプロンプトを集…
★ 161.8k ⑂ 21.1k NOASSERTION 2026-05-08
人気
3か月以内の stars 順
LLM GitHub hermes-web-ui
Hermes Web UIは、AIエージェント「Hermes Agent」のフル機能Webダッシュボードです。AIチャットセッションの管理、…
★ 4.0k ⑂ 493 MIT 2026-05-08
LLM GitHub mercury-agent
Mercuryは、パーミッション強化されたツール、トークン予算管理、および複数チャネルアクセスを備えた、ソウル駆動型…
★ 2.0k ⑂ 210 MIT 2026-05-06
AIエージェント GitHub SkillClaw
AIエージェントのスキルを対話を通じて自動で進化、重複排除、品質向上させるツールです。SkillClawは、個々のエージ…
★ 1.2k ⑂ 117 MIT 2026-04-29
AIエージェント GitHub agent-rules-books
このリポジトリは、AIコーディングエージェント(Codex、Cursor、Claude Codeなど)向けに、ソフトウェアエンジニア…
★ 1.2k ⑂ 171 MIT 2026-05-05
最近人気
1か月以内の stars 順
LLM GitHub hermes-web-ui
Hermes Web UIは、AIエージェント「Hermes Agent」のフル機能Webダッシュボードです。AIチャットセッションの管理、…
★ 4.0k ⑂ 493 MIT 2026-05-08
LLM GitHub mercury-agent
Mercuryは、パーミッション強化されたツール、トークン予算管理、および複数チャネルアクセスを備えた、ソウル駆動型…
★ 2.0k ⑂ 210 MIT 2026-05-06
AIエージェント GitHub SkillClaw
AIエージェントのスキルを対話を通じて自動で進化、重複排除、品質向上させるツールです。SkillClawは、個々のエージ…
★ 1.2k ⑂ 117 MIT 2026-04-29
AIエージェント GitHub agent-rules-books
このリポジトリは、AIコーディングエージェント(Codex、Cursor、Claude Codeなど)向けに、ソフトウェアエンジニア…
★ 1.2k ⑂ 171 MIT 2026-05-05
新着
新しい repo を優先 LLM
GitHub Content-Vigilante
Content Vigilanteは、ブランドガイドと対象コンテンツをもとに、文章がブランドの文体や語彙、構成、読みやすさに合…
★ 1 MIT 2026-05-08
LLM
GitHub FreeRideV3
FreeRideは、複数の無料AI推論プロバイダを1つのローカルOpenAI互換ゲートウェイにまとめるCLIツールです。OpenRoute…
★ 2 MIT 2026-05-08
LLM
GitHub reyn
Reynは、MarkdownとYAMLで定義したスキルをもとに、LLMエージェントの処理フローを制約付きで実行・検証・再現できる…
★ 2 MIT 2026-05-08
LLM GitHub agent-lens
agent-lensは、Claude Code、Codex CLI、Gemini CLI、Cursor、GitHub Copilotなど複数のAIコーディングエージェント…
★ 10 ⑂ 5 2026-05-08
定番
全期間の stars 順 マルチモーダル
HF gemma-4-31B-it
Gemma 4 31B itは、Google DeepMindのオープンウェイトな命令調整済みマルチモーダルモデルです。テキストと画像を入…
❤ 2.6k ↓ 8.7M apache-2.0 2026-05-07
マルチモーダル
HF clip-vit-large-patch14
CLIPのViT-L/14版を提供する研究向け画像・テキスト理解モデルです。画像と自然言語の対応を同一空間で学習し、事前…
❤ 2.0k ↓ 27.4M 2023-09-15
マルチモーダル
HF sam3
SAM 3は、画像と動画に対してプロンプト可能なセグメンテーションを行う統合基盤モデルです。短いテキスト、点、ボッ…
❤ 2.0k ↓ 3.1M other 2025-11-20
マルチモーダル HF GLM-OCR
GLM-OCRは、複雑な文書を高精度に読み取り・解析できるマルチモーダルOCRモデルです。数式、表、情報抽出まで対応し…
❤ 1.7k ↓ 8.2M mit 2026-04-14
人気
3か月以内の stars 順 マルチモーダル
HF gemma-4-31B-it
Gemma 4 31B itは、Google DeepMindのオープンウェイトな命令調整済みマルチモーダルモデルです。テキストと画像を入…
❤ 2.6k ↓ 8.7M apache-2.0 2026-05-07
マルチモーダル HF Qwen3.6-35B-A3B
Qwen3.6-35B-A3Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダル生成モデル…
❤ 1.7k ↓ 3.4M apache-2.0 2026-04-24
マルチモーダル HF Gemma-4-31B-JANG_4M-CRACK
Gemma 4 31BベースのMLX向けマルチモーダル言語モデルで、画像入力を含む対話やコード生成、一般用途のアシスタント…
❤ 1.5k ↓ 156.1k gemma 2026-04-25
マルチモーダル HF Kimi-K2.6
Kimi K2.6は、Moonshot AIが公開するネイティブマルチモーダル対応のオープンソース大規模モデルです。長い手順を要…
❤ 1.2k ↓ 1.2M other 2026-04-30
最近人気
1か月以内の stars 順
マルチモーダル HF Qwen3.6-35B-A3B
Qwen3.6-35B-A3Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダル生成モデル…
❤ 1.7k ↓ 3.4M apache-2.0 2026-04-24
マルチモーダル HF Kimi-K2.6
Kimi K2.6は、Moonshot AIが公開するネイティブマルチモーダル対応のオープンソース大規模モデルです。長い手順を要…
❤ 1.2k ↓ 1.2M other 2026-04-30
マルチモーダル HF Qwen3.6-27B
Qwen3.6-27Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダルモデルです。画…
❤ 1.2k ↓ 2.0M apache-2.0 2026-04-24
マルチモーダル HF Qwen3.6-35B-A3B-GGUF
Qwen3.6-35B-A3B-GGUFは、Unslothが提供するQwen3.6系の量子化モデル配布で、コーディング支援やツール呼び出し、画…
❤ 959 ↓ 2.5M apache-2.0 2026-04-20
新着
新しい repo を優先
マルチモーダル HF Qwopus3.6-35B-A3B-v1-GGUF
Qwopus3.6-35B-A3B-v1-GGUFは、Qwen3.6-35B-A3BをベースにLoRAで推論能力を強化した実験的なGGUF形式モデルです。35B…
❤ 77 ↓ 19.0k apache-2.0 2026-05-07
マルチモーダル HF Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF
このREADMEは、Qwen 3.6系をベースに40Bへ拡張し、Deckard系データセットやClaude 4.6 Opus由来データで多段階調整し…
❤ 37 ↓ 59.2k apache-2.0 2026-05-02
マルチモーダル HF Qwen3.5-9B-DeepSeek-V4-Flash-GGUF
Qwen3.5-9Bをベースに、DeepSeek-V4由来の高品質な推論データで蒸留した軽量推論モデルのREADMEです。多段階の論理展…
❤ 104 ↓ 128.6k apache-2.0 2026-05-02
マルチモーダル HF Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF
このREADMEは、Qwen 3.6 27Bをベースに検閲緩和と追加ファインチューニングを施し、さらにGGUF量子化版を多数用意し…
❤ 98 ↓ 143.9k apache-2.0 2026-04-30
定番
全期間の stars 順
TTS / 音声 HF Kokoro-82M
Kokoroは8200万パラメータを持つオープンウェイトのテキスト読み上げ(TTS)モデルです。軽量なアーキテクチャながら…
❤ 6.1k ↓ 9.5M apache-2.0 2025-04-10
TTS / 音声
HF XTTS-v2
XTTS-v2は、Coquiが開発した高度な音声生成モデルです。わずか6秒の短い音声クリップを用いることで、既存の声を17種…
❤ 3.5k ↓ 7.9M other 2023-12-11
TTS / 音声 HF chatterbox
Chatterboxは、Resemble AIが開発したオープンソースの高品質なテキスト読み上げ(TTS)モデルです。23言語に対応し…
❤ 1.6k ↓ 2.3M mit 2026-04-22
TTS / 音声 HF Qwen3-TTS-12Hz-1.7B-CustomVoice
Qwen3-TTSは、テキストを音声に変換する先進的なモデルで、中国語、英語、日本語を含む10の主要言語と複数の方言プロ…
❤ 1.5k ↓ 1.8M apache-2.0 2026-01-29
人気
3か月以内の stars 順
TTS / 音声 HF OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 809 ↓ 2.2M apache-2.0 2026-05-07
TTS / 音声 HF supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 29 ↓ 530 openrail 2026-05-06
最近人気
1か月以内の stars 順
TTS / 音声 HF supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 29 ↓ 530 openrail 2026-05-06
新着
新しい repo を優先
TTS / 音声 HF supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 29 ↓ 530 openrail 2026-05-06
TTS / 音声 HF OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 809 ↓ 2.2M apache-2.0 2026-05-07
TTS / 音声 HF Qwen3-TTS-12Hz-1.7B-CustomVoice
Qwen3-TTSは、テキストを音声に変換する先進的なモデルで、中国語、英語、日本語を含む10の主要言語と複数の方言プロ…
❤ 1.5k ↓ 1.8M apache-2.0 2026-01-29
ComfyUI GitHub ComfyUI-Maya1_TTS
このツールは、ComfyUI上でMaya1(30億パラメータの音声モデル)を利用し、表現豊かな音声生成を可能にするノードパ…
★ 62 ⑂ 11 Apache-2.0 2025-11-11
定番
全期間の stars 順 音楽・音声生成
HF mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 5 ↓ 168 mit 2026-05-01
人気
3か月以内の stars 順 音楽・音声生成
HF mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 5 ↓ 168 mit 2026-05-01
最近人気
1か月以内の stars 順 音楽・音声生成
HF mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 5 ↓ 168 mit 2026-05-01
新着
新しい repo を優先 音楽・音声生成
HF mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 5 ↓ 168 mit 2026-05-01
定番
全期間の stars 順 ASR / 音声認識
HF whisper-large-v3
Whisper large-v3は、OpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルです。500万時間以上の学習…
❤ 5.7k ↓ 5.1M apache-2.0 2024-08-12
ASR / 音声認識
HF whisper-large-v3-turbo
Whisper large-v3-turboは、OpenAIが提案する最先端の自動音声認識(ASR)および音声翻訳モデルであるWhisper large-…
❤ 3.0k ↓ 7.3M mit 2024-10-04
マルチモーダル HF Voxtral-Small-24B-2507
Voxtral Small 1.0(24B)は、Mistral Small 3系をベースに音声入力機能を強化した大規模音声理解モデルです。音声の…
❤ 493 ↓ 47.6k apache-2.0 2025-12-20
ComfyUI GitHub ComfyUI-Whisper
ComfyUI Whisperは、OpenAIのWhisperモデルを利用して音声の文字起こしや動画への字幕追加を可能にするComfyUIの拡張…
★ 233 ⑂ 38 NOASSERTION 2026-01-02
人気
3か月以内の stars 順
マルチモーダル HF VibeVoice-ASR-HF
VibeVoice-ASR-HFは、Microsoftの長時間音声向け音声認識モデルをTransformers互換で使えるようにしたツールです。最…
❤ 125 ↓ 312.3k mit 2026-03-09
最近人気
1か月以内の stars 順該当する記事がまだありません。
新着
新しい repo を優先
マルチモーダル HF VibeVoice-ASR-HF
VibeVoice-ASR-HFは、Microsoftの長時間音声向け音声認識モデルをTransformers互換で使えるようにしたツールです。最…
❤ 125 ↓ 312.3k mit 2026-03-09
マルチモーダル HF Voxtral-Small-24B-2507
Voxtral Small 1.0(24B)は、Mistral Small 3系をベースに音声入力機能を強化した大規模音声理解モデルです。音声の…
❤ 493 ↓ 47.6k apache-2.0 2025-12-20
ASR / 音声認識
HF whisper-large-v3-turbo
Whisper large-v3-turboは、OpenAIが提案する最先端の自動音声認識(ASR)および音声翻訳モデルであるWhisper large-…
❤ 3.0k ↓ 7.3M mit 2024-10-04
ASR / 音声認識
HF whisperkit-coreml
WhisperKitは、Apple Siliconデバイス向けに設計されたオンデバイス音声AI SDK「Argmax OSS」の一部として提供される…
❤ 174 ↓ 10.6M 2026-04-24
定番
全期間の stars 順 AIエージェント
GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.2k ⑂ 257 MIT 2026-05-04
3D / NeRF HF HY-Motion-1.0
HY-Motion 1.0は、テキスト指示から人型キャラクターの3D骨格モーションを生成できるTencentの大規模Text-to-Motion…
❤ 407 ↓ 467 other 2025-12-31
3D / NeRF HF VoxTell
VoxTellは、自然文のテキスト指示からCT・MRI・PETなどの3D医用画像に対するセグメンテーションマスクを生成できる医…
❤ 15 ↓ 352 cc-by-nc-sa-4.0 2026-03-04
人気
3か月以内の stars 順 AIエージェント
GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.2k ⑂ 257 MIT 2026-05-04
最近人気
1か月以内の stars 順 AIエージェント
GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.2k ⑂ 257 MIT 2026-05-04
新着
新しい repo を優先 AIエージェント
GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.2k ⑂ 257 MIT 2026-05-04
3D / NeRF HF HY-Motion-1.0
HY-Motion 1.0は、テキスト指示から人型キャラクターの3D骨格モーションを生成できるTencentの大規模Text-to-Motion…
❤ 407 ↓ 467 other 2025-12-31
3D / NeRF HF VoxTell
VoxTellは、自然文のテキスト指示からCT・MRI・PETなどの3D医用画像に対するセグメンテーションマスクを生成できる医…
❤ 15 ↓ 352 cc-by-nc-sa-4.0 2026-03-04
定番
全期間の stars 順
マルチモーダル HF RMBG-1.4
BRIA Background Removal v1.4は、画像内の前景を高精度に切り出して背景を除去できる画像セグメンテーションモデル…
❤ 2.0k ↓ 897.8k other 2025-07-06
マルチモーダル
HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 569 ↓ 959.6k mit 2026-02-04
マルチモーダル
HF segformer_b2_clothes
SegFormer B2をATRベースの人間パースデータセットで衣服セグメンテーション向けに微調整したモデルです。人物画像か…
❤ 499 ↓ 225.5k other 2025-09-19
マルチモーダル HF YOLOv8
Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…
❤ 341 ↓ 6.5k agpl-3.0 2025-01-11
人気
3か月以内の stars 順 LLM
GitHub Project_Chronos
プロジェクト クロノスは、MixtralなどのMoE(Mixture-of-Experts)モデルにおいて、SSDからのデータロードによる推…
★ 236 ⑂ 49 Apache-2.0 2026-04-26
最近人気
1か月以内の stars 順 LLM
GitHub Project_Chronos
プロジェクト クロノスは、MixtralなどのMoE(Mixture-of-Experts)モデルにおいて、SSDからのデータロードによる推…
★ 236 ⑂ 49 Apache-2.0 2026-04-26
新着
新しい repo を優先 LLM
GitHub Project_Chronos
プロジェクト クロノスは、MixtralなどのMoE(Mixture-of-Experts)モデルにおいて、SSDからのデータロードによる推…
★ 236 ⑂ 49 Apache-2.0 2026-04-26
マルチモーダル HF BEN2
BEN2は、画像や動画から人物・物体の前景を高精度に切り抜き、背景除去やマスク生成を行うためのPython向けセグメン…
❤ 231 ↓ 225.0k mit 2025-12-31
マルチモーダル
HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 569 ↓ 959.6k mit 2026-02-04
マルチモーダル HF Anzhcs_YOLOs
Anzhcs_YOLOsは、作者自身や協力者が注釈したデータセットを中心に学習したYOLO系モデル集で、顔・目・頭髪・胸部・…
❤ 170 ↓ 86.5k agpl-3.0 2026-02-25