3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
マルチモーダル GitHub CaptionEvalKit-for-VLMs
CaptionEvalKit-for-VLMsは、VLM(Visual Language Model)向け画像キャプション評価を再現性高く、オールインワンで…
★ 7 BSD-3-Clause-Clear 2026-06-22
画像生成 GitHub comfyui-lora-FindingLora
「Finding LoRA — for ComfyUI」は、ComfyUIのLoRAローダーの使い勝手を大幅に改善するカスタムノードです。ブックマ…
★ 7 ⑂ 2 2026-06-07
音声生成 / TTS GitHub book-v2-audio
このツールは、FB2形式の電子書籍をAIによる文学的な解説付きのオーディオブックに変換するデスクトップアプリケーシ…
★ 7 ⑂ 4 MIT 2026-05-24
動画生成 GitHub Awesome-Gemini-Omni-API-Prompts
このリポジトリは、Googleのマルチモーダル動画モデル「Gemini Omni」向けの高品質なプロンプトとパターンを厳選して…
★ 7 ⑂ 1 CC0-1.0 2026-07-01
LLM GitHub reyn
Reynは、MarkdownとYAMLで定義したスキルをもとに、LLMエージェントの処理フローを制約付きで実行・検証・再現できる…
★ 7 MIT 2026-06-28
ASR / 音声認識 GitHub MavKa
MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…
★ 7 ⑂ 1 MIT 2026-05-10
ASR / 音声認識 GitHub SayIt
SayItは、音声入力とAIによるテキスト修正(潤色)を組み合わせたオープンソースツールであり、Typelessの代替となる…
★ 7 ⑂ 2 AGPL-3.0 2026-06-02
ASR / 音声認識 GitHub tastebench
Tastebenchは、ウェブサイト、音楽、ビデオなどのコンテンツの「好み」を定量的に分析し、改善点を提示する自己評価…
★ 7 ⑂ 1 MIT 2026-05-19
画像生成 GitHub sd-ai
SD Studioは、Stable DiffusionとLLMを統合したAI搭載デスクトップアプリケーションです。自然言語で指示を出すだけ…
★ 7 AGPL-3.0 2026-06-29
ASR / 音声認識 GitHub Scripta
Scriptaは、macOS向けのプライバシーを重視した会議用文字起こし&AI要約ツールです。マイクとシステムオーディオの…
★ 7 ⑂ 1 MIT 2026-05-21
音声生成 / TTS GitHub Jarvis-MT67
JARVIS-MT67は、映画「アイアンマン」のJ.A.R.V.I.S.にインスパイアされた、常に稼働し続ける自律型AIパーソナルアシ…
★ 7 ⑂ 4 MIT 2026-04-29
画像生成 GitHub sd-faceswap
このツールは、Stable Diffusion WebUI用の高速な顔交換拡張機能「sd-faceswap」です。InsightFaceによる効率的な顔…
★ 7 MIT 2026-05-19
画像生成 GitHub claude-skill-codex-imagegen
「claude-skill-codex-imagegen」は、AIアシスタント「Claude Code」にOpenAIの高性能画像生成モデル「gpt-image-2」…
★ 7 MIT 2026-05-16
音声生成 / TTS GitHub oai-tts-router
このツールは、OpenAI TTS互換のAPIインターフェースを提供する無料のTTSルーターです。Google Translate、Edge TTS…
★ 7 AGPL-3.0 2026-05-19
ComfyUI GitHub ideogram4_prompter-ComfyUI
このComfyUIカスタムノードは、Ideogram 4のMagic Prompt APIを活用し、ユーザーが入力した簡単なプロンプトを、Ideo…
★ 7 ⑂ 1 MIT 2026-06-04
音声生成 / TTS GitHub gb-speech
「paladin-t/gb-speech」は、ゲームボーイ向けのリアルタイム音声シンセサイザーです。リアルな人の声ではなく、「ト…
★ 7 MIT 2026-05-03
ASR / 音声認識 GitHub VibeRave
VibeRaveは、人気のあるライブコーディング環境Strudelを基盤とし、音声、テキスト、ワンクリックプリセットといった…
★ 7 AGPL-3.0 2026-05-20
AIエージェント GitHub Operon
Operonは、高度な自律型AIターミナルコックピットです。OpenClawとHermes Agentの機能を統合し、ファイル管理、ウェ…
★ 7 ⑂ 1 MIT 2026-06-01
動画生成 GitHub awesome-text-to-image-ai-prompts
このGitHubリポジトリは、テキストから画像を生成するAIプロンプト、AI画像ジェネレーターのワークフロー、クリエイ…
★ 6 2026-04-28
マルチモーダル GitHub 35gateway
「35Gateway」は、35m.aiが開発・運営するソース利用可能なAIゲートウェイです。テキスト、画像、動画、音声、音楽と…
★ 6 ⑂ 1 NOASSERTION 2026-04-15
ASR / 音声認識 GitHub hush
HushはmacOS向けのローカルプッシュトゥトーク音声入力ツールです。指定されたショートカットキー(デフォルトはfnキ…
★ 6 ⑂ 1 MIT 2026-06-10
音声生成 / TTS GitHub claude-code-audio-recap
このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…
★ 6 Apache-2.0 2026-06-18
3D / NeRF GitHub 4dgs-human-avatar-comfyui-nodes-dataset
このリポジトリは、ComfyUI向けの究極の4DGS(4D Gaussian Splatting)モジュール「Shramko-Volumetric-Bridge」と、…
★ 6 Apache-2.0 2026-06-19
画像生成 GitHub CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01