3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

マルチモーダル
GitHub
CaptionEvalKit-for-VLMs
CaptionEvalKit-for-VLMsは、VLM(Visual Language Model)向け画像キャプション評価を再現性高く、オールインワンで…
★ 7 BSD-3-Clause-Clear 2026-06-22
画像生成
GitHub
comfyui-lora-FindingLora
「Finding LoRA — for ComfyUI」は、ComfyUIのLoRAローダーの使い勝手を大幅に改善するカスタムノードです。ブックマ…
★ 7 ⑂ 2 2026-06-07
音声生成 / TTS
GitHub
book-v2-audio
このツールは、FB2形式の電子書籍をAIによる文学的な解説付きのオーディオブックに変換するデスクトップアプリケーシ…
★ 7 ⑂ 4 MIT 2026-05-24
動画生成
GitHub
Awesome-Gemini-Omni-API-Prompts
このリポジトリは、Googleのマルチモーダル動画モデル「Gemini Omni」向けの高品質なプロンプトとパターンを厳選して…
★ 7 ⑂ 1 CC0-1.0 2026-07-01
LLM
GitHub
reyn
Reynは、MarkdownとYAMLで定義したスキルをもとに、LLMエージェントの処理フローを制約付きで実行・検証・再現できる…
★ 7 MIT 2026-06-28
ASR / 音声認識
GitHub
MavKa
MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…
★ 7 ⑂ 1 MIT 2026-05-10
ASR / 音声認識
GitHub
SayIt
SayItは、音声入力とAIによるテキスト修正(潤色)を組み合わせたオープンソースツールであり、Typelessの代替となる…
★ 7 ⑂ 2 AGPL-3.0 2026-06-02
ASR / 音声認識
GitHub
tastebench
Tastebenchは、ウェブサイト、音楽、ビデオなどのコンテンツの「好み」を定量的に分析し、改善点を提示する自己評価…
★ 7 ⑂ 1 MIT 2026-05-19
画像生成
GitHub
sd-ai
SD Studioは、Stable DiffusionとLLMを統合したAI搭載デスクトップアプリケーションです。自然言語で指示を出すだけ…
★ 7 AGPL-3.0 2026-06-29
ASR / 音声認識
GitHub
Scripta
Scriptaは、macOS向けのプライバシーを重視した会議用文字起こし&AI要約ツールです。マイクとシステムオーディオの…
★ 7 ⑂ 1 MIT 2026-05-21
音声生成 / TTS
GitHub
Jarvis-MT67
JARVIS-MT67は、映画「アイアンマン」のJ.A.R.V.I.S.にインスパイアされた、常に稼働し続ける自律型AIパーソナルアシ…
★ 7 ⑂ 4 MIT 2026-04-29
画像生成
GitHub
sd-faceswap
このツールは、Stable Diffusion WebUI用の高速な顔交換拡張機能「sd-faceswap」です。InsightFaceによる効率的な顔…
★ 7 MIT 2026-05-19
画像生成
GitHub
claude-skill-codex-imagegen
「claude-skill-codex-imagegen」は、AIアシスタント「Claude Code」にOpenAIの高性能画像生成モデル「gpt-image-2」…
★ 7 MIT 2026-05-16
音声生成 / TTS
GitHub
oai-tts-router
このツールは、OpenAI TTS互換のAPIインターフェースを提供する無料のTTSルーターです。Google Translate、Edge TTS…
★ 7 AGPL-3.0 2026-05-19
ComfyUI
GitHub
ideogram4_prompter-ComfyUI
このComfyUIカスタムノードは、Ideogram 4のMagic Prompt APIを活用し、ユーザーが入力した簡単なプロンプトを、Ideo…
★ 7 ⑂ 1 MIT 2026-06-04
音声生成 / TTS
GitHub
gb-speech
「paladin-t/gb-speech」は、ゲームボーイ向けのリアルタイム音声シンセサイザーです。リアルな人の声ではなく、「ト…
★ 7 MIT 2026-05-03
ASR / 音声認識
GitHub
VibeRave
VibeRaveは、人気のあるライブコーディング環境Strudelを基盤とし、音声、テキスト、ワンクリックプリセットといった…
★ 7 AGPL-3.0 2026-05-20
AIエージェント
GitHub
Operon
Operonは、高度な自律型AIターミナルコックピットです。OpenClawとHermes Agentの機能を統合し、ファイル管理、ウェ…
★ 7 ⑂ 1 MIT 2026-06-01
マルチモーダル
GitHub
35gateway
「35Gateway」は、35m.aiが開発・運営するソース利用可能なAIゲートウェイです。テキスト、画像、動画、音声、音楽と…
★ 6 ⑂ 1 NOASSERTION 2026-04-15
ASR / 音声認識
GitHub
hush
HushはmacOS向けのローカルプッシュトゥトーク音声入力ツールです。指定されたショートカットキー(デフォルトはfnキ…
★ 6 ⑂ 1 MIT 2026-06-10
音声生成 / TTS
GitHub
claude-code-audio-recap
このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…
★ 6 Apache-2.0 2026-06-18
3D / NeRF
GitHub
4dgs-human-avatar-comfyui-nodes-dataset
このリポジトリは、ComfyUI向けの究極の4DGS(4D Gaussian Splatting)モジュール「Shramko-Volumetric-Bridge」と、…
★ 6 Apache-2.0 2026-06-19
画像生成
GitHub
CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01