540 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

画像生成 57 repos

すべて見る →

最近人気

1か月以内の stars 順
画像生成
GitHub
awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.9k ⑂ 1.4k CC0-1.0 2026-05-11
画像生成
GitHub
awesome-gpt-image-2
YouMind-OpenLabが提供する「Awesome GPT Image 2 Prompts」は、OpenAIの次世代画像生成モデル「GPT Image 2」に特化…
★ 5.5k ⑂ 496 NOASSERTION 2026-05-12
AIエージェント
GitHub
awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 5.0k ⑂ 693 MIT 2026-05-11
画像生成
GitHub
gpt_image_2_skill
このツールは、OpenAIのGPT Image 2モデルを用いた画像生成のためのプロンプトギャラリー、画像プロンプトライブラリ…
★ 1.9k ⑂ 181 MIT 2026-05-08

新着

新しい repo を優先
画像生成
GitHub
mafabi_colab_juggernaut_xl
mafabi_colab_juggernaut_xlは、Google Colab上でStable Diffusion XL (SDXL) のJuggernautバリアントを利用して画像…
★ 1 Apache-2.0 2026-05-11
画像生成
GitHub
codex-gpt-image
「Codex GPT Image Skill」は、OpenClaw、Claude Code、Codex、Hermes AgentといったAIエージェント向けに、GPT-Imag…
★ 1 MIT 2026-05-11
画像生成
GitHub
KinetiDiff
KinetiDiffは、進行性骨化性線維異形成症(FOP)の原因となるACVR1受容体を標的とするキナーゼ阻害剤を設計するため…
★ 1 MIT 2026-05-11
画像生成
GitHub
gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 1 MIT 2026-05-08

動画生成 42 repos

すべて見る →

最近人気

1か月以内の stars 順
動画生成
HF
Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 644 ↓ 157.6k 2026-05-08
画像生成
GitHub
nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 408 ⑂ 22 MIT 2026-05-05
動画生成
GitHub
VEFX-Bench
VEFX-Benchは、テキスト駆動型ビデオ編集および視覚効果の総合的な評価ベンチマークです。5,049件のアノテーション付…
★ 150 ⑂ 16 Apache-2.0 2026-04-20

新着

新しい repo を優先
動画生成
GitHub
agentic-video-maker
このツールは、単一のブリーフから高品質なAI動画を生成するパイプラインです。Geminiによるスクリプト作成、ElevenL…
★ 2 ⑂ 1 MIT 2026-05-12
動画生成
GitHub
ai-content-automation-system
このプロジェクトは、AIまたは手動スクリプト入力からYouTube ShortsやReelsのような短尺縦型動画を自動生成するため…
★ 1 NOASSERTION 2026-05-10
動画生成
GitHub
spinforge-ai
SpinForge AIは、Python、Flaskなどを利用して構築された、AIアシスト付きの360°オブジェクトおよびロゴスピンビデオ…
★ 1 MIT 2026-05-06

ComfyUI 175 repos

すべて見る →

最近人気

1か月以内の stars 順
ComfyUI
GitHub
UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 27 ⑂ 2 GPL-3.0 2026-05-11
ComfyUI
GitHub
comfyui-aeon-spark
このツールは、NVIDIA DGX Spark (GB10 / Blackwell / sm_121a) に特化して最適化された、最先端のComfyUIディストリ…
★ 26 ⑂ 6 2026-05-04
ComfyUI
GitHub
ComfyUI-Subworkflow
ComfyUI-Subworkflowは、ComfyUIの既存ワークフローを再利用可能な「サブワークフロー」として活用するための拡張機…
★ 8 ⑂ 2 GPL-3.0 2026-04-28
ComfyUI
GitHub
VisualBrowserNodes-by-LX
LXによるCivitaiビジュアルブラウザノードは、ComfyUIユーザーがローカルのLoRA、チェックポイント、拡散モデルを効…
★ 2 ⑂ 1 2026-05-11

新着

新しい repo を優先
ComfyUI
GitHub
UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 27 ⑂ 2 GPL-3.0 2026-05-11
ComfyUI
GitHub
ComfyUI-Orakul-SVP
ComfyUI-Orakul-SVPは、ComfyUIの出力画像を高品質なマスターファイルとしてエクスポートするためのカスタムノードで…
★ 1 MIT 2026-05-03
ComfyUI
GitHub
comfyui-aeon-spark
このツールは、NVIDIA DGX Spark (GB10 / Blackwell / sm_121a) に特化して最適化された、最先端のComfyUIディストリ…
★ 26 ⑂ 6 2026-05-04
ComfyUI
GitHub
VisualBrowserNodes-by-LX
LXによるCivitaiビジュアルブラウザノードは、ComfyUIユーザーがローカルのLoRA、チェックポイント、拡散モデルを効…
★ 2 ⑂ 1 2026-05-11

AIエージェント 49 repos

すべて見る →

最近人気

1か月以内の stars 順
AIエージェント
GitHub
terax-ai
Teraxは、Tauri 2、Rust、React 19で構築された、軽量(7MB)かつ高速なオープンソースのAIネイティブターミナルエミ…
★ 2.2k ⑂ 220 Apache-2.0 2026-05-11
LLM
GitHub
skills-manage
`skills-manage`は、Claude Code、Cursor、Gemini CLIなど、20以上のAIコーディングエージェントプラットフォームに…
★ 1.8k ⑂ 166 Apache-2.0 2026-05-02
AIエージェント
GitHub
DeepSeek-Reasonix
DeepSeek-Reasonixは、ターミナルで動作するDeepSeekネイティブのAIコーディングエージェントです。prefix-cacheの安…
★ 1.3k ⑂ 82 MIT 2026-05-12

新着

新しい repo を優先
AIエージェント
GitHub
cord
Cordは、LLM、MCPサーバー、HTTPバックエンド、AIエージェントなどを相互接続する分散型ファブリックです。自然言語…
★ 5 ⑂ 1 Apache-2.0 2026-05-12
AIエージェント
GitHub
natureco-cli
NatureCo CLIは、ターミナルネイティブで動作する強力なAIエージェントCLIツールです。AIとのチャットを通じて、ワー…
★ 1 ⑂ 1 2026-05-12
AIエージェント
GitHub
goalkeeper
goalkeeperは、Claude Codeのための契約駆動型で耐久性のある目標実行ツールです。明確な達成基準(Definition of Do…
★ 6 ⑂ 1 MIT 2026-05-12
AIエージェント
GitHub
praxia
Praxiaは、個人の暗黙知を組織の共有ノウハウへと自動昇格させることに特化した、ワークフロー指向のマルチエージェ…
★ 2 Apache-2.0 2026-05-12

LLM 76 repos

すべて見る →

最近人気

1か月以内の stars 順
LLM
GitHub
garden-skills
Garden Skillsは、Claude Code、Cursor、CodexなどのAIコーディングエージェント向けに、Webデザイン、知識検索、画…
★ 4.5k ⑂ 648 MIT 2026-05-12
LLM
GitHub
mercury-agent
Mercuryは、許可制ツール、トークン予算、マルチチャネルアクセスを備えた、"Soul-driven"なAIエージェントです。重…
★ 2.1k ⑂ 218 MIT 2026-05-10
AIエージェント
GitHub
agent-rules-books
このリポジトリは、リファクタリング、アーキテクチャ、DDD、コード品質に関する古典的なソフトウェア工学の書籍から…
★ 1.3k ⑂ 187 MIT 2026-05-10
LLM
GitHub
openless
OpenLessは、macOSおよびWindows向けのオープンソース音声入力アプリケーションです。ホットキーを押して話すだけで…
★ 1.2k ⑂ 97 MIT 2026-05-12

新着

新しい repo を優先
LLM
GitHub
GenAI-PDF-QA-Assistant
このGenAI PDF Q&Aアシスタントは、Streamlit、LangChain、FAISS、OllamaローカルLLMを活用したAI駆動型ツールです。…
★ 1 2026-05-13
LLM
GitHub
dsm
DSM(Dynamic Segmented Memory)は、LLMのコンテキスト管理と連想推論を革新する高性能な記憶エンジンです。本ツー…
★ 4 MIT 2026-05-12
LLM
GitHub
ChipMATE
ChipMATEは、RTLコード生成のためのマルチエージェント推論フレームワークです。Verilog生成エージェントとPython参…
★ 1 NOASSERTION 2026-05-12
LLM
GitHub
scrape-website-mcp
scrape-website-mcpは、ウェブサイトを高性能にスクレイピングし、クリーンなMarkdown形式でコンテンツを抽出するセ…
★ 1 MIT 2026-05-12

マルチモーダル 67 repos

すべて見る →

最近人気

1か月以内の stars 順
マルチモーダル
HF
Kimi-K2.6
Kimi K2.6は、Moonshot AIが公開するネイティブマルチモーダル対応のオープンソース大規模モデルです。長い手順を要…
❤ 1.3k ↓ 1.4M other 2026-05-11
マルチモーダル
HF
Qwen3.6-27B
Qwen3.6-27Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダルモデルです。画…
❤ 1.2k ↓ 2.4M apache-2.0 2026-04-24
マルチモーダル
HF
Qwen3.6-35B-A3B-GGUF
Qwen3.6-35B-A3B-GGUFは、Unslothが提供するQwen3.6系の量子化モデル配布で、コーディング支援やツール呼び出し、画…
❤ 996 ↓ 2.7M apache-2.0 2026-04-20

新着

新しい repo を優先
マルチモーダル
GitHub
multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 1 MIT 2026-05-13
マルチモーダル
GitHub
vlm-from-scratch
このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…
★ 1 MIT 2026-05-13
マルチモーダル
GitHub
Crucible
Crucibleは、ロボットのデモンストレーションデータを評価・キュレーションするための多軸VLM(Vision-Language Mode…
★ 2 MIT 2026-05-10
マルチモーダル
HF
Qwopus3.6-35B-A3B-v1-GGUF
Qwopus3.6-35B-A3B-v1-GGUFは、Qwen3.6-35B-A3BをベースにLoRAで推論能力を強化した実験的なGGUF形式モデルです。35B…
❤ 111 ↓ 67.2k apache-2.0 2026-05-07

TTS / 音声 15 repos

すべて見る →

最近人気

1か月以内の stars 順
TTS / 音声
HF
supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 96 ↓ 1.8k openrail 2026-05-06

新着

新しい repo を優先
TTS / 音声
HF
supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 96 ↓ 1.8k openrail 2026-05-06
TTS / 音声
GitHub
MOSS-TTS-Nano
MOSS-TTS-Nanoは、MOSI.AIとOpenMOSSチームが開発したオープンソースの多言語対応小型音声生成モデルです。わずか0.1…
★ 2.9k ⑂ 375 Apache-2.0 2026-05-12
TTS / 音声
HF
OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 853 ↓ 2.2M apache-2.0 2026-05-07
TTS / 音声
GitHub
CloneTTS
CloneTTSは、Androidデバイス上で動作する軽量でオフライン対応のテキスト読み上げ(TTS)エンジンです。1〜3秒の音…
★ 618 ⑂ 20 2026-04-28

音楽・音声生成 14 repos

すべて見る →

最近人気

1か月以内の stars 順
音楽・音声生成
GitHub
controlfoley
ControlFoleyは、ビデオ、テキスト、参照オーディオを組み合わせることで、高精度かつ制御可能なビデオ-オーディオ生…
★ 81 ⑂ 2 Apache-2.0 2026-04-22
音楽・音声生成
GitHub
genblaze
Genblazeは、生成AIによるビデオ、画像、オーディオのメディアパイプラインを構築・オーケストレーションするためのP…
★ 10 MIT 2026-05-11
音楽・音声生成
HF
mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 5 ↓ 177 mit 2026-05-01
音楽・音声生成
GitHub
ACE-Step-Studio-pinokio
「ACE-Step Studio — Pinokio launcher」は、ローカルでAI音楽生成を可能にする「ACE-Step Studio」のワンクリックク…
★ 5 ⑂ 3 MIT 2026-05-06

新着

新しい repo を優先
音楽・音声生成
GitHub
vibe-sing
Vibe-singは、Claude Codeセッションの終わりに、そのセッションのトランスクリプトからユーザーの気分を読み取り、…
★ 3 MIT 2026-05-11
音楽・音声生成
GitHub
studiomi300
studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…
★ 5 ⑂ 1 MIT 2026-05-12
音楽・音声生成
GitHub
aeon-music-maker
aeon-music-makerは、AEON Media Productionファミリーの一部であるスタンドアロンの音楽生成ツールです。ACE Step 1…
★ 5 ⑂ 2 MIT 2026-05-01
音楽・音声生成
GitHub
Stable-Audio-Insight
Stable Audio Insightは、Stability AIの「Stable Audio Open 1.0」を基盤としたWindows向けのローカルオーディオ生…
★ 3 NOASSERTION 2026-04-30

ASR / 音声認識 13 repos

すべて見る →

最近人気

1か月以内の stars 順
ASR / 音声認識
GitHub
handy-companion
macOS向けの「handy-companion」は、無料のオフライン音声認識アプリ「Handy」で生成された文字起こしテキストを、大…
★ 4 MIT 2026-05-12

新着

新しい repo を優先
ASR / 音声認識
GitHub
handy-companion
macOS向けの「handy-companion」は、無料のオフライン音声認識アプリ「Handy」で生成された文字起こしテキストを、大…
★ 4 MIT 2026-05-12
ASR / 音声認識
GitHub
OmniVoice-Studio
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。リアルタイムディクテーション、3秒の音声クリップ…
★ 512 ⑂ 40 NOASSERTION 2026-05-11
マルチモーダル
HF
VibeVoice-ASR-HF
VibeVoice-ASR-HFは、Microsoftの長時間音声向け音声認識モデルをTransformers互換で使えるようにしたツールです。最…
❤ 127 ↓ 295.2k mit 2026-03-09
ASR / 音声認識
GitHub
typewhisper-mac
TypeWhisper for Macは、macOSユーザー向けの高性能なローカル音声認識およびAIテキスト処理ツールです。WhisperKit…
★ 1.1k ⑂ 72 GPL-3.0 2026-05-12

3D / NeRF 23 repos

すべて見る →

最近人気

1か月以内の stars 順
AIエージェント
GitHub
text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.4k ⑂ 283 MIT 2026-05-11
3D / NeRF
GitHub
TokenGS
TokenGSは、自己教師ありレンダリング目的で3Dガウスを予測する革新的なツールです。学習可能なガウストークンをエン…
★ 161 ⑂ 3 Apache-2.0 2026-04-20
3D / NeRF
GitHub
habitat-gs
Habitat-GSは、Facebook ResearchのHabitat-Simを基盤とした、高忠実度ナビゲーションシミュレーターです。3D Gaussi…
★ 124 ⑂ 6 MIT 2026-05-10
3D / NeRF
GitHub
3DGS-PLY-3DTiles-Converter
「3DGS-PLY-3DTiles-Converter」は、Gaussian SplattingのPLYファイルを効率的に3D Tiles形式へ変換するNode.jsベー…
★ 74 ⑂ 6 Apache-2.0 2026-05-11

新着

新しい repo を優先
3D / NeRF
GitHub
Ghost-Eye
Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU(ピーク時…
★ 1 Apache-2.0 2026-05-10
3D / NeRF
GitHub
RetrieveVGGT
RetrieveVGGTは、トレーニング不要で長時間のストリーミング3D再構築を可能にする革新的なフレームワークです。VGGT…
★ 3 Apache-2.0 2026-05-12
3D / NeRF
GitHub
sam-3d-spark
sam-3d-sparkは、MetaのSAM 3D(BodyおよびObjects)モデルをNVIDIA DGX Spark環境(aarch64/CUDA 13)でローカル実…
★ 1 NOASSERTION 2026-05-03
3D / NeRF
GitHub
gaussian_lic_ros2
このツールは、LiDAR-Inertial-Camera Gaussian Splatting SLAMのROS2ネイティブポートであり、Gaussian-LIC/Gaussia…
★ 1 GPL-3.0 2026-05-13

その他 8 repos

すべて見る →

最近人気

1か月以内の stars 順
LLM
GitHub
Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 281 ⑂ 49 Apache-2.0 2026-04-26

新着

新しい repo を優先
LLM
GitHub
Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 281 ⑂ 49 Apache-2.0 2026-04-26
マルチモーダル
HF
BEN2
BEN2は、画像や動画から人物・物体の前景を高精度に切り抜き、背景除去やマスク生成を行うためのPython向けセグメン…
❤ 232 ↓ 225.5k mit 2025-12-31
マルチモーダル
HF
BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 576 ↓ 992.7k mit 2026-02-04
マルチモーダル
HF
Anzhcs_YOLOs
Anzhcs_YOLOsは、作者自身や協力者が注釈したデータセットを中心に学習したYOLO系モデル集で、顔・目・頭髪・胸部・…
❤ 170 ↓ 83.9k agpl-3.0 2026-02-25