3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

画像生成
GitHub
Heat-Diffusion
このリポジトリは、MAiTL-Groupによる「Physics-Informed DeepMRI: k-Space Interpolation Meets Heat Diffusion」の…
★ 2 MIT 2026-05-24
LLM
GitHub
AGENT33-PUBLIC
AGENT-33は、ローカルファーストのマルチエージェントオーケストレーションプラットフォームです。複数のAIエージェ…
★ 2 Apache-2.0 2026-05-28
ASR / 音声認識
GitHub
Vox
Voxは、Windowsユーザー向けのオフライン音声テキスト変換ツールです。右Ctrlキーを押して話すだけで、チャット、ブ…
★ 2 ⑂ 2 MIT 2026-05-24
マルチモーダル
GitHub
rag-multimodal
このプロジェクトは、複雑な表や図を含むPDF文書から情報を抽出するマルチモーダルRAGシステムの実装デモです。マル…
★ 2 MIT 2026-06-21
ComfyUI
GitHub
Agnes
Agnesは、テキストからビデオを生成する2段階のAIパイプラインを提供するツールです。最大の特徴は、画像生成UIであ…
★ 2 MIT 2026-06-06
マルチモーダル
GitHub
omni-retrieval
omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…
★ 2 Apache-2.0 2026-06-08
ComfyUI
GitHub
ComfyUI_PromptExtractor_nodes
ComfyUI向けのカスタムノード集で、ComfyUIが生成したPNG画像のメタデータからプロンプトを抽出できます。元のワーク…
★ 2 ⑂ 1 MIT 2026-04-07
ComfyUI
GitHub
ComfyUI-HiCache
ComfyUI-HiCacheは、ComfyUIでHunyuan3Dの形状生成を加速するための、トレーニング不要なノードです。flow-matching…
★ 2 ⑂ 1 MIT 2026-06-11
3D / NeRF
GitHub
EasyTraceSTL
EasyTraceSTLは、3Dプリントメーカー向けの無料、オフラインで非常にシンプルな3Dデザインツールです。画像を取り込…
★ 2 2026-06-17
画像生成
GitHub
zimage-skill
zimage-skillは、自然言語のテキスト記述からAIが美しい画像を生成するツールです。プログラミングの知識がなくても…
★ 2 MIT 2026-06-27
画像生成
GitHub
Awesome-Diffusion-RL
このリポジトリは、画像および動画の拡散モデルにおける強化学習(RL)、RLHF、DPO、GRPO、報酬モデル、選好最適化に…
★ 2 Apache-2.0 2026-05-19
動画生成
GitHub
seedance-sizzle-tutorial
このチュートリアルは、Seedance 2.0 AI動画生成を活用し、シネマティックなSizzle Reelを作成する方法を解説します…
★ 2 ⑂ 1 2026-03-31
動画生成
GitHub
sora-api
Mountsea AIが提供するSora 2 APIは、OpenAIの最新AIビデオ生成モデル「Sora 2 (Sora Pro, Sora2)」への安価で簡単な…
★ 2 MIT 2026-05-27
LLM
GitHub
SmallMind
SmallMindは、C#のみで構築されたプロダクション対応のローカル言語モデル推論エンジンです。外部MLフレームワークや…
★ 2 MIT 2026-05-19
3D / NeRF
GitHub
3dgs-detail-zoom-annotator
「3DGS Detail Zoom Annotator」は、3DGS(3D Gaussian Splatting)やNeRF、3D再構築などの研究論文における図表作成…
★ 2 MIT 2026-03-26
ASR / 音声認識
GitHub
deckle
Deckleは、ローカルファーストのWindowsユーティリティで、ホットキーによる音声文字起こし、リアルタイム画面キャプ…
★ 2 MIT 2026-06-16
マルチモーダル
GitHub
sentra-rag-failure-modes
このリポジトリは、Googleの最新マルチモーダル埋め込みモデル`gemini-embedding-2`の経験的失敗モードと幾何学的特…
★ 2 MIT 2026-05-08
ComfyUI
GitHub
ComfyUI-PromptDrafter-SceneQueue
ComfyUI-PromptDrafter-SceneQueueは、画像生成AIツールComfyUIの拡張機能であるComfyUI-PromptDrafterのコンパニオ…
★ 2 ⑂ 1 MIT 2026-03-20
ASR / 音声認識
GitHub
macOS-dictate
macOS向けのプライバシーを重視した自己ホスト型音声入力ツールです。ホットキーを押しながら話すことで、音声をテキ…
★ 2 MIT 2026-06-25
音声生成 / TTS
GitHub
lingo-agent
LINGOは、中小企業向けに設計されたベータ版のAI電話エージェントバックエンドです。リアルな電話番号を持ち、永続的…
★ 2 2026-06-18
音声生成 / TTS
GitHub
avataraisdk
avataraisdkは、任意のウェブサイトに簡単に組み込める3D AIアバターSDKです。リアルタイムのリップシンクと多言語音…
★ 2 MIT 2026-05-28
画像生成
GitHub
dify-plugin-muapi
このツールは、MuAPIをDifyに統合するカスタムプラグインです。Difyのワークフロー、チャットフロー、エージェントか…
★ 2 ⑂ 1 2026-06-15
画像生成
GitHub
Flux.2-Klein-Small-Decoder-Only
Flux.2-Klein-Small-Decoder-Onlyは、FLUX.2-klein-4BモデルとFLUX.2-small-decoder VAEを専用に利用する、実験的な…
★ 2 ⑂ 1 Apache-2.0 2026-06-18
ASR / 音声認識
GitHub
IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 2 MIT 2026-06-22