765 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

画像生成 87 repos

すべて見る →

最近人気

1か月以内の stars 順
画像生成
GitHub
awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.9k ⑂ 1.4k CC0-1.0 2026-05-11
画像生成
GitHub
guizang-ppt-skill
「Guizang PPT Skill」は、Claude CodeやCodexなどのAIエージェント向けに設計されたスキルです。洗練されたHTML形式…
★ 8.9k ⑂ 722 MIT 2026-05-15
画像生成
GitHub
awesome-gpt-image-2
YouMind-OpenLabが提供する「Awesome GPT Image 2 Prompts」は、OpenAIの次世代画像生成モデル「GPT Image 2」に特化…
★ 5.5k ⑂ 496 NOASSERTION 2026-05-12
AIエージェント
GitHub
awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 5.0k ⑂ 693 MIT 2026-05-11

新着

新しい repo を優先
画像生成
GitHub
DSCA-ReID-Framework
DSCA-ReID Frameworkは、人物再識別システムに対する拡散モデルベースのセマンティックカモフラージュ攻撃(DSCA)の…
★ 1 MIT 2026-05-14
画像生成
GitHub
chatwalaau
ChatWalaʻauは、AIエージェントのランタイムをローカル環境で提供するフルスタックツールです。`pip install`一つで…
★ 1 Apache-2.0 2026-05-14
画像生成
GitHub
ComfyUI-PlagueKind-Nodes
このツールは、画像生成AIのワークフロー構築ツールであるComfyUI向けのカスタムノードです。画像とマスクのサイズ変…
★ 4 ⑂ 1 MIT 2026-05-14
画像生成
GitHub
Stream_Mirror
StreamMirrorは、Webカメラの映像をリアルタイムでアニメ、水墨画、ファンタジーなどのスタイルに変換し、ブラウザに…
★ 1 MIT 2026-05-13

動画生成 63 repos

すべて見る →

最近人気

1か月以内の stars 順
動画生成
HF
Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 644 ↓ 157.6k 2026-05-08
画像生成
GitHub
nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 408 ⑂ 22 MIT 2026-05-05
動画生成
GitHub
VEFX-Bench
VEFX-Benchは、テキスト駆動型ビデオ編集および視覚効果の総合的な評価ベンチマークです。5,049件のアノテーション付…
★ 150 ⑂ 16 Apache-2.0 2026-04-20

新着

新しい repo を優先
動画生成
GitHub
ai-video-generation
このリポジトリは、Frameloop API を用いたAI動画自動化のための実用的な「curlレシピ集」です。顔出しなしのYouTube…
★ 1 2026-05-13
動画生成
GitHub
ai-video-pipeline
このツールは、AIを活用してスクリプト作成、画像検索、音声合成、最終的なMP4動画生成までを完全に自動化する、無料…
★ 2 2026-05-13
動画生成
GitHub
agentic-video-maker
このツールは、単一のブリーフから高品質なAI動画を生成するパイプラインです。Geminiによるスクリプト作成、ElevenL…
★ 2 ⑂ 1 MIT 2026-05-12
動画生成
GitHub
ai-content-automation-system
このプロジェクトは、AIまたは手動スクリプト入力からYouTube ShortsやReelsのような短尺縦型動画を自動生成するため…
★ 1 NOASSERTION 2026-05-10

ComfyUI 193 repos

すべて見る →

最近人気

1か月以内の stars 順
ComfyUI
GitHub
UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 27 ⑂ 2 GPL-3.0 2026-05-11
ComfyUI
GitHub
comfyui-aeon-spark
このツールは、NVIDIA DGX Spark (GB10 / Blackwell / sm_121a) に特化して最適化された、最先端のComfyUIディストリ…
★ 26 ⑂ 6 2026-05-04
ComfyUI
GitHub
comfyui-deno-custom-nodes
Deno2026/comfyui-deno-custom-nodesは、ComfyUIのワークフローを高速化し、実用的な改善をもたらすカスタムノード集…
★ 23 ⑂ 4 Unlicense 2026-05-15
ComfyUI
GitHub
ComfyUI-Sapiens2-Easy
「ComfyUI-Sapiens2-Easy」は、Meta Sapiens2モデルをComfyUIのネイティブノードとして統合するツールです。単一の画…
★ 19 ⑂ 2 NOASSERTION 2026-05-04

新着

新しい repo を優先
ComfyUI
GitHub
Pixal3D-ComfyUI
Pixal3D-ComfyUIは、単一の画像から高品質な3Dモデルを生成するためのComfyUI用カスタムノードです。TencentARCのPix…
★ 3 ⑂ 1 NOASSERTION 2026-05-15
ComfyUI
GitHub
ComfyUI-Pixal3D
ComfyUI-Pixal3Dは、Tencentの「Pixal3D」パイプラインをComfyUIで利用するためのカスタムノードです。単一の画像か…
★ 4 ⑂ 1 NOASSERTION 2026-05-14
ComfyUI
GitHub
NulleCore-eAI
「NulleCore-eAI」は、Windows向けのローカルファーストAIクリエイティブワークステーションです。オフラインでのAI…
★ 1 NOASSERTION 2026-05-13
ComfyUI
GitHub
UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 27 ⑂ 2 GPL-3.0 2026-05-11

AIエージェント 68 repos

すべて見る →

最近人気

1か月以内の stars 順
AIエージェント
GitHub
terax-ai
Teraxは、Tauri 2、Rust、React 19で構築された、軽量(7MB)かつ高速なオープンソースのAIネイティブターミナルエミ…
★ 2.2k ⑂ 220 Apache-2.0 2026-05-11
AIエージェント
GitHub
DeepSeek-Reasonix
DeepSeek-Reasonixは、ターミナルで動作するDeepSeekネイティブのAIコーディングエージェントです。prefix-cacheの安…
★ 1.3k ⑂ 82 MIT 2026-05-12
AIエージェント
GitHub
oh-story-claudecode
このツールは、長編および短編のウェブ小説執筆を支援する「oh-story-claudecode」スキルパックです。市場トレンド分…
★ 997 ⑂ 244 MIT 2026-05-12

新着

新しい repo を優先
AIエージェント
GitHub
deepscene
DeepSceneは、オープンソースのビデオ-ストーリーボードCLIエージェントであり、低コストで動画の深い理解を実現しま…
★ 1 MIT 2026-05-14
AIエージェント
GitHub
bug-bounty-hunting-agent
このツールは、AIを活用したバグバウンティハンティングのための包括的な知識ベースです。Matomo、Jetpack、WooComme…
★ 1 ⑂ 1 MIT 2026-05-13
AIエージェント
GitHub
cord
Cordは、LLM、MCPサーバー、HTTPバックエンド、AIエージェントなどを相互接続する分散型ファブリックです。自然言語…
★ 5 ⑂ 1 Apache-2.0 2026-05-12
AIエージェント
GitHub
cocada
Cocadaは、テキストの自由記述指示からコードを自動生成し、GitHubでプルリクエストを準備する無料のオープンソース…
★ 2 MIT 2026-05-14

LLM 110 repos

すべて見る →

最近人気

1か月以内の stars 順
LLM
GitHub
browser-harness
Browser Harnessは、大規模言語モデル(LLM)をChrome DevTools Protocolを介して実際のブラウザに直接接続し、ウェ…
★ 12.7k ⑂ 1.2k MIT 2026-05-15
LLM
GitHub
garden-skills
Garden Skillsは、Claude Code、Cursor、CodexなどのAIコーディングエージェント向けに、Webデザイン、知識検索、画…
★ 4.5k ⑂ 648 MIT 2026-05-12
LLM
GitHub
mercury-agent
Mercuryは、許可制ツール、トークン予算、マルチチャネルアクセスを備えた、"Soul-driven"なAIエージェントです。重…
★ 2.1k ⑂ 218 MIT 2026-05-10
AIエージェント
GitHub
agent-rules-books
このリポジトリは、リファクタリング、アーキテクチャ、DDD、コード品質に関する古典的なソフトウェア工学の書籍から…
★ 1.3k ⑂ 187 MIT 2026-05-10

新着

新しい repo を優先
LLM
GitHub
pdf-analyzer
このツールは、PDF文書の内容に基づいた質問応答を可能にするRAG(検索拡張生成)システムです。PDFをアップロードす…
★ 1 2026-05-14
LLM
GitHub
sibyl
Sibylは、TemporalとGo言語で構築された、堅牢なマルチエージェント収束フレームワークです。ResearcherとCriticの2…
★ 1 2026-05-14
LLM
GitHub
DAYA
DAYAは、イラスト豊富なドキュメント(プレゼンテーション資料など)に特化した、ドキュメント認識型ハイブリッドア…
★ 2 Apache-2.0 2026-05-13
LLM
GitHub
GenAI-PDF-QA-Assistant
このGenAI PDF Q&Aアシスタントは、Streamlit、LangChain、FAISS、OllamaローカルLLMを活用したAI駆動型ツールです。…
★ 1 2026-05-13

マルチモーダル 80 repos

すべて見る →

最近人気

1か月以内の stars 順
マルチモーダル
HF
Qwen3.6-27B
Qwen3.6-27Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダルモデルです。画…
❤ 1.2k ↓ 2.4M apache-2.0 2026-04-24
マルチモーダル
HF
Qwen3.6-35B-A3B-GGUF
Qwen3.6-35B-A3B-GGUFは、Unslothが提供するQwen3.6系の量子化モデル配布で、コーディング支援やツール呼び出し、画…
❤ 996 ↓ 2.7M apache-2.0 2026-04-20
マルチモーダル
HF
Qwen3.6-27B-GGUF
Qwen3.6-27B-GGUFは、Qwen3.6-27Bをもとにしたオープンウェイトの大規模言語・視覚対応モデルで、コード生成、リポジ…
❤ 654 ↓ 1.5M apache-2.0 2026-04-22

新着

新しい repo を優先
マルチモーダル
GitHub
multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 1 MIT 2026-05-13
マルチモーダル
GitHub
vlm-from-scratch
このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…
★ 1 MIT 2026-05-13
マルチモーダル
GitHub
clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
マルチモーダル
GitHub
Crucible
Crucibleは、ロボットのデモンストレーションデータを評価・キュレーションするための多軸VLM(Vision-Language Mode…
★ 2 MIT 2026-05-10

TTS / 音声 46 repos

すべて見る →

最近人気

1か月以内の stars 順
TTS / 音声
HF
supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 96 ↓ 1.8k openrail 2026-05-06
TTS / 音声
GitHub
ZeusHammer
ZeusHammerは、AIエージェントのコスト、速度、プライバシー、オフライン利用、記憶能力といった課題を解決するため…
★ 69 ⑂ 14 2026-04-25
TTS / 音声
GitHub
korean-voice-acting-engine
Korean Voice Acting Engine (KVAE) は、韓国語音声に特化したローカルファーストのツールキットです。ユーザーが自…
★ 64 ⑂ 5 NOASSERTION 2026-05-05
TTS / 音声
GitHub
video-recap
「video-recap」は、入力された動画に対して自動で中国語のナレーション付き解説動画を生成するスキルです。動画の内…
★ 60 ⑂ 10 2026-05-13

新着

新しい repo を優先
TTS / 音声
GitHub
Irodori-TTS-Server
「Irodori OpenAI TTS Server」は、Aratako/Irodori-TTSの500M v3ベースモデル向けに開発された、OpenAI Text-to-Spe…
★ 5 MIT 2026-05-14
TTS / 音声
GitHub
voxtral-fastapi
voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…
★ 1 2026-05-13
TTS / 音声
GitHub
openclaw
OpenClawは、ユーザー自身のデバイス上で動作する自己ホスト型パーソナルAIアシスタントです。WhatsAppやTelegramな…
★ 2 MIT 2026-05-13
TTS / 音声
GitHub
voice-to-text
CogNativeは、既存の声をクローンし、その声で別の言語の音声を生成できる翻訳音声合成ツールです。GUIとCLIの両方を…
★ 3 2026-05-13

音楽・音声生成 26 repos

すべて見る →

最近人気

1か月以内の stars 順
音楽・音声生成
GitHub
genblaze
Genblazeは、生成AIによるビデオ、画像、オーディオのメディアパイプラインを構築・オーケストレーションするためのP…
★ 10 MIT 2026-05-11
音楽・音声生成
HF
mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 5 ↓ 177 mit 2026-05-01
音楽・音声生成
GitHub
ACE-Step-Studio-pinokio
「ACE-Step Studio — Pinokio launcher」は、ローカルでAI音楽生成を可能にする「ACE-Step Studio」のワンクリックク…
★ 5 ⑂ 3 MIT 2026-05-06
音楽・音声生成
GitHub
aeon-music-maker
aeon-music-makerは、AEON Media Productionファミリーの一部であるスタンドアロンの音楽生成ツールです。ACE Step 1…
★ 5 ⑂ 2 MIT 2026-05-01

新着

新しい repo を優先
音楽・音声生成
GitHub
vibe-sing
Vibe-singは、Claude Codeセッションの終わりに、そのセッションのトランスクリプトからユーザーの気分を読み取り、…
★ 3 MIT 2026-05-11
音楽・音声生成
GitHub
studiomi300
studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…
★ 5 ⑂ 1 MIT 2026-05-12
音楽・音声生成
GitHub
PiAPI-Skills
このツールは、AIコーディングエージェントがPiAPIを介してMidjourney、Suno、Kling、Lumaなどの多様なAIモデル群を…
★ 3 MIT 2026-05-12
音楽・音声生成
GitHub
photo_sonification
静止画像を音楽に変換するインタラクティブなWebアプリです。AIモデルに頼らず、輝度、コントラスト、対称性といった…
★ 1 MIT 2026-05-13

ASR / 音声認識 45 repos

すべて見る →

最近人気

1か月以内の stars 順
ASR / 音声認識
GitHub
ArcSub
ArcSubは、クラウドサービスとローカルのOpenVINOモデルの両方を活用するエンドツーエンドの字幕翻訳ワークステーシ…
★ 52 ⑂ 12 MIT 2026-05-13
ASR / 音声認識
GitHub
ai-video-editing-skill
このAIエージェントスキルは、旅行で撮影した大量の動画素材から、自動的にVlogを生成します。ユーザーは素材フォル…
★ 33 ⑂ 4 MIT 2026-04-27
ASR / 音声認識
GitHub
FastWord
FastWordは、macOSユーザー向けのプライベートでローカルなプッシュトゥトーク音声入力アプリケーションです。ホット…
★ 32 ⑂ 3 2026-05-13
ASR / 音声認識
GitHub
TypelessMLX
このTypelessMLXは、macOS向けの音声文字変換(ディクテーション)アプリケーションです。Apple Silicon向けに最適化…
★ 28 ⑂ 2 2026-04-26

新着

新しい repo を優先
ASR / 音声認識
GitHub
agentdictate
AgentDictateは、Linux環境向けのプッシュツートーク音声入力アプリケーションです。OpenAIの音声テキスト変換APIを…
★ 2 MIT 2026-05-14
ASR / 音声認識
GitHub
Auto-Vod-Trimmer
VOD Auto Trimmerは、長時間のVODを手動で編集する手間を省くためのマルチスレッドPythonツールです。ローカルAI(Wh…
★ 1 GPL-3.0 2026-05-15
ASR / 音声認識
GitHub
voxtral-journal
このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…
★ 1 NOASSERTION 2026-05-14

3D / NeRF 38 repos

すべて見る →

最近人気

1か月以内の stars 順
AIエージェント
GitHub
text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.4k ⑂ 283 MIT 2026-05-11
3D / NeRF
GitHub
TokenGS
TokenGSは、自己教師ありレンダリング目的で3Dガウスを予測する革新的なツールです。学習可能なガウストークンをエン…
★ 161 ⑂ 3 Apache-2.0 2026-04-20
3D / NeRF
GitHub
3DGS-PLY-3DTiles-Converter
「3DGS-PLY-3DTiles-Converter」は、Gaussian SplattingのPLYファイルを効率的に3D Tiles形式へ変換するNode.jsベー…
★ 74 ⑂ 6 Apache-2.0 2026-05-11
3D / NeRF
GitHub
MuGS
MuGSは、MuJoCo物理シミュレーションと3D Gaussian Splatting (3DGS) を組み合わせたハイブリッドレンダリングパイプ…
★ 45 ⑂ 1 NOASSERTION 2026-05-11

新着

新しい repo を優先
3D / NeRF
GitHub
classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
3D / NeRF
GitHub
Ghost-Eye
Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU(ピーク時…
★ 1 Apache-2.0 2026-05-10
3D / NeRF
GitHub
RetrieveVGGT
RetrieveVGGTは、トレーニング不要で長時間のストリーミング3D再構築を可能にする革新的なフレームワークです。VGGT…
★ 3 Apache-2.0 2026-05-12
3D / NeRF
GitHub
sam-3d-spark
sam-3d-sparkは、MetaのSAM 3D(BodyおよびObjects)モデルをNVIDIA DGX Spark環境(aarch64/CUDA 13)でローカル実…
★ 1 NOASSERTION 2026-05-03

その他 8 repos

すべて見る →

最近人気

1か月以内の stars 順
LLM
GitHub
Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 281 ⑂ 49 Apache-2.0 2026-04-26

新着

新しい repo を優先
LLM
GitHub
Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 281 ⑂ 49 Apache-2.0 2026-04-26
マルチモーダル
HF
BEN2
BEN2は、画像や動画から人物・物体の前景を高精度に切り抜き、背景除去やマスク生成を行うためのPython向けセグメン…
❤ 232 ↓ 225.5k mit 2025-12-31
マルチモーダル
HF
BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 576 ↓ 992.7k mit 2026-02-04
マルチモーダル
HF
Anzhcs_YOLOs
Anzhcs_YOLOsは、作者自身や協力者が注釈したデータセットを中心に学習したYOLO系モデル集で、顔・目・頭髪・胸部・…
❤ 170 ↓ 83.9k agpl-3.0 2026-02-25