ComfyUI GitHub StabilityMatrix
Stability Matrixは、Stable Diffusion向けのマルチプラットフォームパッケージマネージャーおよび推論UIです。AUTOM…
★ 8.4k ⑂ 575 AGPL-3.0 2026-06-16
画像生成 GitHub imagen-pytorch
lucidrains/imagen-pytorchは、Googleが開発した最先端のText-to-Imageニューラルネットワーク「Imagen」のPyTorch実…
★ 8.4k ⑂ 800 MIT 2024-10-07
動画生成 GitHub Sana
SANAは、NVIDIAが開発した高解像度画像および動画生成のための効率的なコードベースです。線形拡散トランスフォーマ…
★ 8.4k ⑂ 671 Apache-2.0 2026-06-25
ASR / 音声認識 GitHub ASRT_SpeechRecognition
ASRTは、TensorFlow.kerasを基盤とした深層学習ベースの中国語音声認識システムです。深度畳み込みニューラルネット…
★ 8.4k ⑂ 1.9k GPL-3.0 2026-04-10
LLM GitHub claude-obsidian
「claude-obsidian」は、Andrej KarpathyのLLM Wikiパターンを基盤とした、ClaudeとObsidianを連携させる知識コンパ…
★ 8.2k ⑂ 941 MIT 2026-05-28
マルチモーダル GitHub minimind-v
MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトで…
★ 8.2k ⑂ 897 Apache-2.0 2026-05-19
画像生成 GitHub dream-textures
BlenderにStable Diffusionを統合するアドオン「Dream Textures」は、テキストプロンプトからテクスチャ、コンセプト…
★ 8.2k ⑂ 437 GPL-3.0 2024-08-26
画像生成 GitHub nexa-sdk
NexaSDKは、AIモデルをデバイス上で最小限のエネルギーで高速かつスマートに実行するための高性能ローカル推論フレー…
★ 8.1k ⑂ 1.0k Apache-2.0 2026-06-25
画像生成 GitHub awesome-gpt4o-images
このリポジトリは、OpenAIのGPT-4oとgpt-image-1によって生成された魅力的な画像とプロンプトの厳選されたコレクショ…
★ 8.1k ⑂ 1.8k NOASSERTION 2025-05-26
画像生成 GitHub PaddleGAN
PaddleGANは、開発者向けに高性能な敵対的生成ネットワーク(GAN)の古典的および最先端の実装を提供するフレームワ…
★ 8.0k ⑂ 1.2k Apache-2.0 2024-07-03
3D / NeRF GitHub LiveTalking
LiveTalkingは、リアルタイムでインタラクティブなストリーミングデジタルヒューマンを作成・操作するためのツールで…
★ 8.0k ⑂ 1.3k Apache-2.0 2026-06-20
AIエージェント GitHub awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 8.0k ⑂ 1.0k MIT 2026-06-20
音声生成 / TTS GitHub Vision-Agents
StreamのOpen Vision Agentsは、リアルタイムビデオAIを構築するためのマルチモーダルAIエージェントフレームワーク…
★ 8.0k ⑂ 662 Apache-2.0 2026-06-24
ComfyUI GitHub fast-stable-diffusion
TheLastBen/fast-stable-diffusionは、Google Colab上でStable Diffusion環境を迅速に構築・実行するためのノートブ…
★ 7.9k ⑂ 1.4k MIT 2025-11-29
AIエージェント GitHub Upsonic
Upsonicは、Pythonで自律型AIエージェントや従来のAIエージェントを構築するためのフレームワークです。大規模言語モ…
★ 7.9k ⑂ 737 MIT 2026-06-18
画像生成 GitHub MochiDiffusion
Mochi Diffusionは、Apple Silicon搭載Mac向けに最適化されたStable DiffusionおよびFLUX.2 Kleinのネイティブアプリ…
★ 7.9k ⑂ 363 GPL-3.0 2026-06-21
画像生成 GitHub awesome-gpt-image-2
YouMind-OpenLabが提供する「Awesome GPT Image 2 Prompts」は、OpenAIの次世代画像生成モデル「GPT Image 2」に特化…
★ 7.9k ⑂ 716 NOASSERTION 2026-06-28
音声生成 / TTS GitHub vits
VITSは、エンドツーエンドのテキスト読み上げ(Text-to-Speech, TTS)システムであり、条件付き変分オートエンコーダ…
★ 7.9k ⑂ 1.4k MIT 2023-12-06
画像生成 GitHub Dreambooth-Stable-Diffusion
本リポジトリは、GoogleのDreamboothのアイデアをStable Diffusionに実装したものです。従来のTextual Inversionが単…
★ 7.7k ⑂ 799 MIT 2022-12-08
LLM GitHub rig
Rigは、スケーラブルでモジュール化された人間工学的なLLM(大規模言語モデル)アプリケーションを構築するためのRus…
★ 7.7k ⑂ 857 MIT 2026-06-23
ASR / 音声認識 GitHub OmniVoice-Studio
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。リアルタイムディクテーション、3秒の音声クリップ…
★ 7.7k ⑂ 1.2k NOASSERTION 2026-06-28
AIエージェント GitHub inkos
InkOSは、AIエージェントが小説の執筆、監査、改訂を自律的に行うためのツールです。人間によるレビューゲートを設け…
★ 7.6k ⑂ 1.4k AGPL-3.0 2026-06-25
ComfyUI GitHub ComfyUI-Workflows-ZHO
「ComfyUI Workflows ZHO」は、人気のAI画像生成インターフェースであるComfyUI向けの、多岐にわたるワークフローを…
★ 7.6k ⑂ 699 GPL-3.0 2024-12-20
LLM GitHub Horizon
Horizonは、AIを活用して個人のニュースレーダーを構築し、日報形式のブリーフィングを英語と中国語で提供するツール…
★ 7.6k ⑂ 1.1k MIT 2026-06-28