655 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

画像生成 67 repos

すべて見る →

最近人気

1か月以内の stars 順
画像生成
GitHub
awesome-gpt-image-2-API-and-Prompts
OpenAIのGPT-Image-2モデルで使用できる、400以上の高品質なプロンプトを集めたリポジトリです。ポートレート、ポス…
★ 13.9k ⑂ 1.4k CC0-1.0 2026-05-11
画像生成
GitHub
awesome-gpt-image-2
YouMind-OpenLabが提供する「Awesome GPT Image 2 Prompts」は、OpenAIの次世代画像生成モデル「GPT Image 2」に特化…
★ 5.5k ⑂ 496 NOASSERTION 2026-05-12
AIエージェント
GitHub
awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジ…
★ 5.0k ⑂ 693 MIT 2026-05-11
画像生成
GitHub
gpt_image_2_skill
このツールは、OpenAIのGPT Image 2モデルを用いた画像生成のためのプロンプトギャラリー、画像プロンプトライブラリ…
★ 1.9k ⑂ 181 MIT 2026-05-08

新着

新しい repo を優先
画像生成
GitHub
mafabi_colab_juggernaut_xl
mafabi_colab_juggernaut_xlは、Google Colab上でStable Diffusion XL (SDXL) のJuggernautバリアントを利用して画像…
★ 1 Apache-2.0 2026-05-11
画像生成
GitHub
codex-gpt-image
「Codex GPT Image Skill」は、OpenClaw、Claude Code、Codex、Hermes AgentといったAIエージェント向けに、GPT-Imag…
★ 1 MIT 2026-05-11
画像生成
GitHub
KinetiDiff
KinetiDiffは、進行性骨化性線維異形成症(FOP)の原因となるACVR1受容体を標的とするキナーゼ阻害剤を設計するため…
★ 1 MIT 2026-05-11
画像生成
GitHub
gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 1 MIT 2026-05-08

動画生成 60 repos

すべて見る →

最近人気

1か月以内の stars 順
動画生成
HF
Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 644 ↓ 157.6k 2026-05-08
画像生成
GitHub
nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 408 ⑂ 22 MIT 2026-05-05
動画生成
GitHub
VEFX-Bench
VEFX-Benchは、テキスト駆動型ビデオ編集および視覚効果の総合的な評価ベンチマークです。5,049件のアノテーション付…
★ 150 ⑂ 16 Apache-2.0 2026-04-20

新着

新しい repo を優先
動画生成
GitHub
ai-video-generation
このリポジトリは、Frameloop API を用いたAI動画自動化のための実用的な「curlレシピ集」です。顔出しなしのYouTube…
★ 1 2026-05-13
動画生成
GitHub
ai-video-pipeline
このツールは、AIを活用してスクリプト作成、画像検索、音声合成、最終的なMP4動画生成までを完全に自動化する、無料…
★ 2 2026-05-13
動画生成
GitHub
agentic-video-maker
このツールは、単一のブリーフから高品質なAI動画を生成するパイプラインです。Geminiによるスクリプト作成、ElevenL…
★ 2 ⑂ 1 MIT 2026-05-12
動画生成
GitHub
ai-content-automation-system
このプロジェクトは、AIまたは手動スクリプト入力からYouTube ShortsやReelsのような短尺縦型動画を自動生成するため…
★ 1 NOASSERTION 2026-05-10

ComfyUI 181 repos

すべて見る →

最近人気

1か月以内の stars 順
ComfyUI
GitHub
UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 27 ⑂ 2 GPL-3.0 2026-05-11
ComfyUI
GitHub
comfyui-aeon-spark
このツールは、NVIDIA DGX Spark (GB10 / Blackwell / sm_121a) に特化して最適化された、最先端のComfyUIディストリ…
★ 26 ⑂ 6 2026-05-04
ComfyUI
GitHub
ComfyUI-Sapiens2-Easy
「ComfyUI-Sapiens2-Easy」は、Meta Sapiens2モデルをComfyUIのネイティブノードとして統合するツールです。単一の画…
★ 19 ⑂ 2 NOASSERTION 2026-05-04
ComfyUI
GitHub
ComfyUI-Subworkflow
ComfyUI-Subworkflowは、ComfyUIの既存ワークフローを再利用可能な「サブワークフロー」として活用するための拡張機…
★ 8 ⑂ 2 GPL-3.0 2026-04-28

新着

新しい repo を優先
ComfyUI
GitHub
UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 27 ⑂ 2 GPL-3.0 2026-05-11
ComfyUI
GitHub
ComfyUI-Orakul-SVP
ComfyUI-Orakul-SVPは、ComfyUIの出力画像を高品質なマスターファイルとしてエクスポートするためのカスタムノードで…
★ 1 MIT 2026-05-03
ComfyUI
GitHub
ComfyUI-Sapiens2-Easy
「ComfyUI-Sapiens2-Easy」は、Meta Sapiens2モデルをComfyUIのネイティブノードとして統合するツールです。単一の画…
★ 19 ⑂ 2 NOASSERTION 2026-05-04
ComfyUI
GitHub
comfyui-aeon-spark
このツールは、NVIDIA DGX Spark (GB10 / Blackwell / sm_121a) に特化して最適化された、最先端のComfyUIディストリ…
★ 26 ⑂ 6 2026-05-04

AIエージェント 55 repos

すべて見る →

最近人気

1か月以内の stars 順
AIエージェント
GitHub
terax-ai
Teraxは、Tauri 2、Rust、React 19で構築された、軽量(7MB)かつ高速なオープンソースのAIネイティブターミナルエミ…
★ 2.2k ⑂ 220 Apache-2.0 2026-05-11
AIエージェント
GitHub
DeepSeek-Reasonix
DeepSeek-Reasonixは、ターミナルで動作するDeepSeekネイティブのAIコーディングエージェントです。prefix-cacheの安…
★ 1.3k ⑂ 82 MIT 2026-05-12
AIエージェント
GitHub
oh-story-claudecode
このツールは、長編および短編のウェブ小説執筆を支援する「oh-story-claudecode」スキルパックです。市場トレンド分…
★ 997 ⑂ 244 MIT 2026-05-12

新着

新しい repo を優先
AIエージェント
GitHub
bug-bounty-hunting-agent
このツールは、AIを活用したバグバウンティハンティングのための包括的な知識ベースです。Matomo、Jetpack、WooComme…
★ 1 ⑂ 1 MIT 2026-05-13
AIエージェント
GitHub
cord
Cordは、LLM、MCPサーバー、HTTPバックエンド、AIエージェントなどを相互接続する分散型ファブリックです。自然言語…
★ 5 ⑂ 1 Apache-2.0 2026-05-12
AIエージェント
GitHub
octo-web
OCTO Webは、人間とAIエージェントが協業するオープンな職場環境「OCTO」のためのWebおよびデスクトップ(Electron)…
★ 28 ⑂ 5 Apache-2.0 2026-05-13
AIエージェント
GitHub
natureco-cli
NatureCo CLIは、ターミナルネイティブで動作する強力なAIエージェントCLIツールです。AIとのチャットを通じて、ワー…
★ 1 ⑂ 1 2026-05-12

LLM 86 repos

すべて見る →

最近人気

1か月以内の stars 順
LLM
GitHub
garden-skills
Garden Skillsは、Claude Code、Cursor、CodexなどのAIコーディングエージェント向けに、Webデザイン、知識検索、画…
★ 4.5k ⑂ 648 MIT 2026-05-12
LLM
GitHub
mercury-agent
Mercuryは、許可制ツール、トークン予算、マルチチャネルアクセスを備えた、"Soul-driven"なAIエージェントです。重…
★ 2.1k ⑂ 218 MIT 2026-05-10
AIエージェント
GitHub
agent-rules-books
このリポジトリは、リファクタリング、アーキテクチャ、DDD、コード品質に関する古典的なソフトウェア工学の書籍から…
★ 1.3k ⑂ 187 MIT 2026-05-10
LLM
GitHub
openless
OpenLessは、macOSおよびWindows向けのオープンソース音声入力アプリケーションです。ホットキーを押して話すだけで…
★ 1.2k ⑂ 97 MIT 2026-05-12

新着

新しい repo を優先
LLM
GitHub
pdf-analyzer
このツールは、PDF文書の内容に基づいた質問応答を可能にするRAG(検索拡張生成)システムです。PDFをアップロードす…
★ 1 2026-05-14
LLM
GitHub
DAYA
DAYAは、イラスト豊富なドキュメント(プレゼンテーション資料など)に特化した、ドキュメント認識型ハイブリッドア…
★ 2 Apache-2.0 2026-05-13
LLM
GitHub
GenAI-PDF-QA-Assistant
このGenAI PDF Q&Aアシスタントは、Streamlit、LangChain、FAISS、OllamaローカルLLMを活用したAI駆動型ツールです。…
★ 1 2026-05-13
LLM
GitHub
local-ai-research-assistant
このツールは、OllamaなどのローカルLLM、ウェブ検索、コンテンツ抽出、および構造化レポート生成を活用した自律的な…
★ 1 MIT 2026-05-14

マルチモーダル 71 repos

すべて見る →

最近人気

1か月以内の stars 順
マルチモーダル
HF
Kimi-K2.6
Kimi K2.6は、Moonshot AIが公開するネイティブマルチモーダル対応のオープンソース大規模モデルです。長い手順を要…
❤ 1.3k ↓ 1.4M other 2026-05-11
マルチモーダル
HF
Qwen3.6-27B
Qwen3.6-27Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダルモデルです。画…
❤ 1.2k ↓ 2.4M apache-2.0 2026-04-24
マルチモーダル
HF
Qwen3.6-35B-A3B-GGUF
Qwen3.6-35B-A3B-GGUFは、Unslothが提供するQwen3.6系の量子化モデル配布で、コーディング支援やツール呼び出し、画…
❤ 996 ↓ 2.7M apache-2.0 2026-04-20

新着

新しい repo を優先
マルチモーダル
GitHub
multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 1 MIT 2026-05-13
マルチモーダル
GitHub
vlm-from-scratch
このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…
★ 1 MIT 2026-05-13
マルチモーダル
GitHub
clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
マルチモーダル
GitHub
Crucible
Crucibleは、ロボットのデモンストレーションデータを評価・キュレーションするための多軸VLM(Vision-Language Mode…
★ 2 MIT 2026-05-10

TTS / 音声 36 repos

すべて見る →

最近人気

1か月以内の stars 順
TTS / 音声
HF
supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 96 ↓ 1.8k openrail 2026-05-06
TTS / 音声
GitHub
ZeusHammer
ZeusHammerは、AIエージェントのコスト、速度、プライバシー、オフライン利用、記憶能力といった課題を解決するため…
★ 69 ⑂ 14 2026-04-25
TTS / 音声
GitHub
korean-voice-acting-engine
Korean Voice Acting Engine (KVAE) は、韓国語音声に特化したローカルファーストのツールキットです。ユーザーが自…
★ 64 ⑂ 5 NOASSERTION 2026-05-05
TTS / 音声
GitHub
video-recap
「video-recap」は、入力された動画に対して自動で中国語のナレーション付き解説動画を生成するスキルです。動画の内…
★ 60 ⑂ 10 2026-05-13

新着

新しい repo を優先
TTS / 音声
GitHub
voxtral-fastapi
voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…
★ 1 2026-05-13
TTS / 音声
GitHub
openclaw
OpenClawは、ユーザー自身のデバイス上で動作する自己ホスト型パーソナルAIアシスタントです。WhatsAppやTelegramな…
★ 2 MIT 2026-05-13
TTS / 音声
GitHub
voice-to-text
CogNativeは、既存の声をクローンし、その声で別の言語の音声を生成できる翻訳音声合成ツールです。GUIとCLIの両方を…
★ 3 2026-05-13
TTS / 音声
GitHub
say-lab
Say Labは、大規模言語モデルとクラウドTTS(Text-to-Speech)を活用した軽量な自ホスト型発音練習Webページです。単…
★ 1 2026-05-13

音楽・音声生成 24 repos

すべて見る →

最近人気

1か月以内の stars 順
音楽・音声生成
GitHub
controlfoley
ControlFoleyは、ビデオ、テキスト、参照オーディオを組み合わせることで、高精度かつ制御可能なビデオ-オーディオ生…
★ 81 ⑂ 2 Apache-2.0 2026-04-22
音楽・音声生成
GitHub
genblaze
Genblazeは、生成AIによるビデオ、画像、オーディオのメディアパイプラインを構築・オーケストレーションするためのP…
★ 10 MIT 2026-05-11
音楽・音声生成
HF
mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 5 ↓ 177 mit 2026-05-01
音楽・音声生成
GitHub
ACE-Step-Studio-pinokio
「ACE-Step Studio — Pinokio launcher」は、ローカルでAI音楽生成を可能にする「ACE-Step Studio」のワンクリックク…
★ 5 ⑂ 3 MIT 2026-05-06

新着

新しい repo を優先
音楽・音声生成
GitHub
vibe-sing
Vibe-singは、Claude Codeセッションの終わりに、そのセッションのトランスクリプトからユーザーの気分を読み取り、…
★ 3 MIT 2026-05-11
音楽・音声生成
GitHub
studiomi300
studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…
★ 5 ⑂ 1 MIT 2026-05-12
音楽・音声生成
GitHub
PiAPI-Skills
このツールは、AIコーディングエージェントがPiAPIを介してMidjourney、Suno、Kling、Lumaなどの多様なAIモデル群を…
★ 3 MIT 2026-05-12
音楽・音声生成
GitHub
photo_sonification
静止画像を音楽に変換するインタラクティブなWebアプリです。AIモデルに頼らず、輝度、コントラスト、対称性といった…
★ 1 MIT 2026-05-13

ASR / 音声認識 34 repos

すべて見る →

最近人気

1か月以内の stars 順
ASR / 音声認識
GitHub
ArcSub
ArcSubは、クラウドサービスとローカルのOpenVINOモデルの両方を活用するエンドツーエンドの字幕翻訳ワークステーシ…
★ 52 ⑂ 12 MIT 2026-05-13
ASR / 音声認識
GitHub
ora
Oraは、macOS向けのリアルタイムローカル音声翻訳アプリケーションです。Apple Silicon Mac上で動作し、全ての処理を…
★ 35 ⑂ 4 MIT 2026-05-07
ASR / 音声認識
GitHub
ai-video-editing-skill
このAIエージェントスキルは、旅行で撮影した大量の動画素材から、自動的にVlogを生成します。ユーザーは素材フォル…
★ 33 ⑂ 4 MIT 2026-04-27
ASR / 音声認識
GitHub
FastWord
FastWordは、macOSユーザー向けのプライベートでローカルなプッシュトゥトーク音声入力アプリケーションです。ホット…
★ 32 ⑂ 3 2026-05-13

新着

新しい repo を優先
ASR / 音声認識
GitHub
voxtral-journal
このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…
★ 1 NOASSERTION 2026-05-14
ASR / 音声認識
GitHub
VoxCore
VoxCoreは、サブ秒の低遅延で動作するオープンソースのリアルタイム音声AIエンジンです。ASR(自動音声認識)、LLM(…
★ 1 Apache-2.0 2026-05-13
ASR / 音声認識
GitHub
VoiceGPT
VoiceGPTは、GPT-4oとDALL·E 3を搭載した音声制御AIアシスタントです。ユーザーは「hello」というウェイクワードでア…
★ 1 2026-05-12

3D / NeRF 32 repos

すべて見る →

最近人気

1か月以内の stars 順
AIエージェント
GitHub
text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 2.4k ⑂ 283 MIT 2026-05-11
3D / NeRF
GitHub
TokenGS
TokenGSは、自己教師ありレンダリング目的で3Dガウスを予測する革新的なツールです。学習可能なガウストークンをエン…
★ 161 ⑂ 3 Apache-2.0 2026-04-20
3D / NeRF
GitHub
habitat-gs
Habitat-GSは、Facebook ResearchのHabitat-Simを基盤とした、高忠実度ナビゲーションシミュレーターです。3D Gaussi…
★ 124 ⑂ 6 MIT 2026-05-10
3D / NeRF
GitHub
3DGS-PLY-3DTiles-Converter
「3DGS-PLY-3DTiles-Converter」は、Gaussian SplattingのPLYファイルを効率的に3D Tiles形式へ変換するNode.jsベー…
★ 74 ⑂ 6 Apache-2.0 2026-05-11

新着

新しい repo を優先
3D / NeRF
GitHub
classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
3D / NeRF
GitHub
Ghost-Eye
Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU(ピーク時…
★ 1 Apache-2.0 2026-05-10
3D / NeRF
GitHub
RetrieveVGGT
RetrieveVGGTは、トレーニング不要で長時間のストリーミング3D再構築を可能にする革新的なフレームワークです。VGGT…
★ 3 Apache-2.0 2026-05-12
3D / NeRF
GitHub
sam-3d-spark
sam-3d-sparkは、MetaのSAM 3D(BodyおよびObjects)モデルをNVIDIA DGX Spark環境(aarch64/CUDA 13)でローカル実…
★ 1 NOASSERTION 2026-05-03

その他 8 repos

すべて見る →

最近人気

1か月以内の stars 順
LLM
GitHub
Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 281 ⑂ 49 Apache-2.0 2026-04-26

新着

新しい repo を優先
LLM
GitHub
Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 281 ⑂ 49 Apache-2.0 2026-04-26
マルチモーダル
HF
BEN2
BEN2は、画像や動画から人物・物体の前景を高精度に切り抜き、背景除去やマスク生成を行うためのPython向けセグメン…
❤ 232 ↓ 225.5k mit 2025-12-31
マルチモーダル
HF
BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 576 ↓ 992.7k mit 2026-02-04
マルチモーダル
HF
Anzhcs_YOLOs
Anzhcs_YOLOsは、作者自身や協力者が注釈したデータセットを中心に学習したYOLO系モデル集で、顔・目・頭髪・胸部・…
❤ 170 ↓ 83.9k agpl-3.0 2026-02-25