155 repos · 10 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ComfyUI 74 repos

すべて見る →
✨ 新規追加
ComfyUI
GitHub
ComfyUI-ConnectTheDots
ComfyUI-ConnectTheDotsは、人気のある画像生成UI「ComfyUI」のための拡張機能です。大規模なワークフローにおいて、…
★ 36 ⑂ 4 MIT 2026-05-02
ComfyUI
GitHub
ComfyUI-CorridorKey
ComfyUI-CorridorKeyは、ComfyUIユーザー向けにCorridorKeyのネイティブ推論ノードを提供するカスタムノードパッケー…
★ 43 ⑂ 3 NOASSERTION 2026-03-02
ComfyUI
GitHub
comfyui-node-organizer
ComfyUI Node Organizerは、ComfyUIのワークフロー内のノードをコンパクトかつグループを考慮して自動的に整列・整理…
★ 54 ⑂ 3 AGPL-3.0 2026-03-24
ComfyUI
GitHub
comfyui-sdnq
「ComfyUI-SDNQ」は、ComfyUIユーザーが大規模な画像生成モデルを少ないVRAMで効率的に実行するためのツールです。本…
★ 79 ⑂ 12 GPL-3.0 2026-04-13

AIエージェント 23 repos

すべて見る →
✨ 新規追加
AIエージェント
GitHub
Photo-agents
コンピュータの画面を視覚的に認識し、人間のようにPCを操作する自己進化型AIエージェントを構築するためのPythonフ…
★ 184 ⑂ 10 MIT 2026-05-08
AIエージェント
GitHub
Photo-agents
Photo Agentsは、視覚情報に基づいてPCを操作する自律進化型エージェントです。画面上の情報を認識し、推論し、行動…
★ 184 ⑂ 10 MIT 2026-05-07
AIエージェント
GitHub
opencode-chrome-annotation
「OpenCode Chrome Annotation」は、Chromeブラウザ上で任意のウェブページに直接注釈を付け、そのスクリーンショッ…
★ 62 ⑂ 3 GPL-3.0 2026-04-30
AIエージェント
GitHub
PaperPlotHub
PaperPlotHubは、研究者向けのオープンソースの論文図表共有プラットフォームです。論文で使用された図表とその生成…
★ 55 ⑂ 2 MIT 2026-04-26

画像生成 19 repos

すべて見る →
✨ 新規追加
画像生成
GitHub
awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 4.4k ⑂ 626 MIT 2026-05-07
画像生成
GitHub
awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.2k ⑂ 1.3k CC0-1.0 2026-05-08
Stable Diffusion / 画像生成
GitHub
Illustrious-NoobAI-Style-Explorer
Illustrious XL & NoobAI-XL Style Explorerは、AIアーティストやプロンプトエンジニア向けに開発された、高性能なイ…
★ 64 ⑂ 10 MIT 2026-04-28
画像生成
GitHub
spellcaster
Spellcasterは、GIMP、DaVinci Resolve、Darktableなどのクリエイティブアプリケーションと連携し、AIを活用した画像…
★ 51 ⑂ 2 NOASSERTION 2026-05-07

動画生成 12 repos

すべて見る →
✨ 新規追加
動画生成
HF
Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 346 2026-05-06
動画生成
GitHub
nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 387 ⑂ 21 MIT 2026-05-05
動画生成
GitHub
OpenMontage
OpenMontageは、世界初となるオープンソースのエージェント型動画制作システムです。AIコーディングアシスタントを本…
★ 3.5k ⑂ 704 AGPL-3.0 2026-05-07
動画生成
GitHub
RefAlign
RefAlignは、参照画像をもとに動画を生成するReference-to-Video向けのPyTorch実装です。学習時にDiTの参照分岐特徴…
★ 256 ⑂ 22 NOASSERTION 2026-04-22

LLM 10 repos

すべて見る →
✨ 新規追加
LLM
GitHub
mercury-agent
Mercuryは、パーミッション強化されたツール、トークン予算管理、および複数チャネルアクセスを備えた、ソウル駆動型…
★ 2.0k ⑂ 209 MIT 2026-05-06
LLM
GitHub
agent-rules-books
このリポジトリは、AIコーディングエージェント(Codex、Cursor、Claude Codeなど)向けに、ソフトウェアエンジニア…
★ 1.2k ⑂ 164 MIT 2026-05-05
LLM
GitHub
sqz
sqzは、LLM (大規模言語モデル) のコンテキストを圧縮することで、トークン消費量を削減し、コストを抑えるためのツ…
★ 210 ⑂ 7 NOASSERTION 2026-05-06
LLM
GitHub
hermes-web-ui
Hermes Web UIは、AIエージェント「Hermes Agent」のフル機能Webダッシュボードです。AIチャットセッションの管理、…
★ 3.8k ⑂ 471 MIT 2026-05-07

TTS / 音声 7 repos

すべて見る →
✨ 新規追加
TTS / 音声
HF
OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 789 apache-2.0 2026-04-22
TTS / 音声
HF
Qwen3-TTS-12Hz-1.7B-CustomVoice
Qwen3-TTSは、テキストを音声に変換する先進的なモデルで、中国語、英語、日本語を含む10の主要言語と複数の方言プロ…
❤ 1.5k apache-2.0 2026-01-29
TTS / 音声
GitHub
ComfyUI-Maya1_TTS
このツールは、ComfyUI上でMaya1(30億パラメータの音声モデル)を利用し、表現豊かな音声生成を可能にするノードパ…
★ 62 ⑂ 11 Apache-2.0 2025-11-11
TTS / 音声
GitHub
ComfyUI-KaniTTS
ComfyUI-KaniTTSは、ComfyUI用のカスタムノードとして、リアルタイムアプリケーションに最適化された高速・高忠実度…
★ 38 ⑂ 3 Apache-2.0 2025-10-17

ASR / 音声認識 5 repos

すべて見る →
✨ 新規追加
ASR / 音声認識
HF
whisper-large-v3-turbo
Whisper large-v3-turboは、OpenAIが提案する最先端の自動音声認識(ASR)および音声翻訳モデルであるWhisper large-…
❤ 3.0k mit 2024-10-04
ASR / 音声認識
HF
whisperkit-coreml
WhisperKitは、Apple Siliconデバイス向けに設計されたオンデバイス音声AI SDK「Argmax OSS」の一部として提供される…
❤ 173 2026-04-24
ASR / 音声認識
GitHub
ComfyUI-Whisper
ComfyUI Whisperは、OpenAIのWhisperモデルを利用して音声の文字起こしや動画への字幕追加を可能にするComfyUIの拡張…
★ 233 ⑂ 38 NOASSERTION 2026-01-02
ASR / 音声認識
HF
whisper-large-v3
Whisper large-v3は、OpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルです。500万時間以上の学習…
❤ 5.7k apache-2.0 2024-08-12

マルチモーダル 2 repos

すべて見る →
✨ 新規追加
マルチモーダル
GitHub
DISCO
DISCOは、タンパク質配列と3次元構造を同時に設計できる拡散ベースのマルチモーダル生成モデルです。小分子リガンド…
★ 165 ⑂ 19 Apache-2.0 2026-04-09
マルチモーダル
GitHub
ComfyUI-Ollama-Describer
ComfyUI-Ollama-Describerは、ComfyUIの拡張機能で、Ollamaの多様なLLMモデル(Gemma、Llava、Llama2/3、Mistralなど…
★ 116 ⑂ 23 MIT 2026-03-19

3D / NeRF 1 repos

すべて見る →
✨ 新規追加
3D / NeRF
GitHub
text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.1k ⑂ 250 MIT 2026-05-04

その他 1 repos

すべて見る →
✨ 新規追加
未分類
GitHub
Project_Chronos
プロジェクト クロノスは、MixtralなどのMoE(Mixture-of-Experts)モデルにおいて、SSDからのデータロードによる推…
★ 221 ⑂ 49 Apache-2.0 2026-04-26