3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub storyvox
Storyvoxは、TechEmpowerが提供するオープンソースのAndroid向けニューラル音声オーディオブックプレーヤーです。Roy…
★ 3 ⑂ 2 GPL-3.0 2026-07-01
画像生成 GitHub gpt-image-2-skills
このツールは、Image2Studioが提供するGPT Image 2のプロンプト、画像リファレンス、視覚的な例を検索するためのエー…
★ 3 2026-04-30
ASR / 音声認識 GitHub voicelog
voicelogは、セルフホスト型のTelegramボイスジャーナルです。プライベートなTelegramボットに音声メッセージやテキ…
★ 3 MIT 2026-06-22
マルチモーダル GitHub kaggle-llm-server
このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。無料のKaggle …
★ 3 ⑂ 4 2026-05-24
画像生成 GitHub knx-skills
knx-skillsは、AIコーディングアシスタントの能力を向上させるための実用的なスキルセットを提供します。マークダウ…
★ 3 2026-07-01
画像生成 GitHub awesome-ai-image-prompts
このリポジトリは、GPT-Image-2、Nano Banana、Seedance、Qwen-VL、Gemini ImagenなどのAI画像生成モデル向けの、955…
★ 3 ⑂ 2 Apache-2.0 2026-05-26
マルチモーダル GitHub reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-21
ASR / 音声認識 GitHub Sirious
Siriousは、macOS上でローカルの音声コマンドのトランスクリプトを分類し、ルーティングする早期開発段階のアプリケ…
★ 3 NOASSERTION 2026-06-17
ComfyUI GitHub comfyui-mirror-panel
ComfyUI Mirror Panelは、ComfyUIの複雑なワークフローの操作性とパフォーマンスを大幅に向上させるプラグインです。…
★ 3 GPL-3.0 2026-05-05
ComfyUI GitHub ComfyUI-mflux-AnyModel
「ComfyUI-mflux-AnyModel」は、Apple Silicon(MLX/Metal)環境でComfyUIを使用して、あらゆるmflux/MLXモデルを実…
★ 3 ⑂ 1 MIT 2026-06-08
動画生成 GitHub ai-video-skill
このツールは、Claude Code向けに設計されたAIビデオ生成スキルです。プロンプトから最終的な編集まで、エンドツーエ…
★ 3 MIT 2026-06-09
音声生成 / TTS GitHub supertonic3-book-reader
「EPUB TTS Reader API」は、EPUBファイルをテキストに変換し、Supertonic-3モデルを使用してテキスト読み上げ(TTS…
★ 3 MIT 2026-05-15
3D / NeRF GitHub TGS-SLAM
TGS-SLAMは、IEEE Robotics and Automation Letters (RA-L) に採択されたセマンティックRGB-D SLAMシステムです。本…
★ 3 2026-05-28
ASR / 音声認識 GitHub scenelens
Scenelensは、Claudeにスマートな動画入力機能を提供するツールです。動画からシーン変化に基づいて最適なフレームを…
★ 3 MIT 2026-05-04
音声生成 / TTS GitHub MiniBox
MiniBoxは、GPT-SoVITSによる高品質な音声合成とクラウドLLMを組み合わせた、キャラクターボイスチャットボットです…
★ 3 ⑂ 2 MIT 2026-06-08
LLM GitHub PFD-toolkit
PFD Toolkitは、Future Death (PFD) レポートの収集、スクリーニング、テーマ発見といった手作業をAIで自動化し、構…
★ 3 ⑂ 1 AGPL-3.0 2026-06-22
音声生成 / TTS GitHub ghosttone-ai
GhostTone AIは、CPUで動作する無料のオープンソース音声クローンシステムです。わずか6〜10秒の音声サンプルから、…
★ 3 MIT 2026-05-15
3D / NeRF GitHub FoveaCore
FoveaEngineは、Godot 4.6+向けに開発された次世代VRレンダリングエンジンです。従来の3Dパイプラインを超越するため…
★ 3 MIT 2026-06-27
LLM GitHub agentbrainsystem
「agentbrainsystem」は、AIコーディングエージェント(Claude Code/MCPなど)向けのローカルファーストな永続メモリ…
★ 3 ⑂ 1 MIT 2026-06-19
ASR / 音声認識 GitHub pi-whisper-voice
「pi-whisper-voice」は、Piコーディングエージェント向けの音声入力ツールです。SPACEキーを長押しするだけで録音を…
★ 3 MIT 2026-04-27
LLM GitHub ring-fenced-rag
Ring-Fenced RAG (RFR)は、自己ホスト型でゼロトラストの検索拡張生成(RAG)システムです。特徴は、データベースレ…
★ 3 ⑂ 1 MIT 2026-06-23
ComfyUI GitHub xenolith-graph
XenolithGraphは、AIネイティブでウェブに組み込み可能なノードグラフエディタです。Blueprintスタイルの型付きピン…
★ 3 MIT 2026-06-08
画像生成 GitHub gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 3 MIT 2026-05-08
マルチモーダル GitHub vid2llm
vid2llmは、あらゆる動画からマルチモーダル言語モデル(LLM)向けのフレームを効率的に抽出するPythonツールキット…
★ 3 Apache-2.0 2026-06-23