3,627 repos GH 3,512 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
tts-blendr
VoiceBlend-TUIは、Textualフレームワークで構築されたターミナルUI(TUI)アプリケーションです。テキストファイル…
★ 1 2026-04-29
ASR / 音声認識
GitHub
resilient-stt
Resilient STTは、OpenAI互換のASR(自動音声認識)エンドポイントと連携し、音声ファイルを高精度にテキスト変換す…
★ 1 ⑂ 1 GPL-3.0 2026-06-25
LLM
GitHub
TOKEN_BANK-manage-your-token-usage
TOKENBANKは、AIコーディングアシスタントのトークン使用量と費用を詳細に統計・管理するためのデスクトップアプリケ…
★ 1 2026-06-01
3D / NeRF
GitHub
3DGS-Runpod
3DGS-Runpodは、RunPod GPUインフラストラクチャを活用し、画像セットから3D Gaussian Splatting(.ply形式)を生成…
★ 1 Apache-2.0 2026-03-11
動画生成
GitHub
awesome-ai-film
「awesome-ai-film」は、AIが映画制作にもたらす変革を探求し、関連するツールや技術を厳選して紹介するキュレーショ…
★ 1 MIT 2026-06-04
LLM
GitHub
light-ai-playground
AI Playgroundは、LLMエージェントの実験に特化したローカル開発ツールです。ユーザーはMarkdownでエージェントを記…
★ 1 MIT 2026-06-12
音声生成 / TTS
GitHub
Cadence
Cadenceは、Windowsユーザー向けのプライベートかつローカルファーストな会議録音・文字起こしツールです。会議音声…
★ 1 MIT 2026-06-16
LLM
GitHub
docintel
DocIntelは、RAG(検索拡張生成)技術を用いたAIドキュメントインテリジェンスシステムです。PDF、DOCX、TXT、Markdo…
★ 1 2026-06-23
画像生成
GitHub
grok-image-mcp
「Grok Image MCP」は、xAIの画像生成・編集サービス「Grok Imagine」をAIコーディングエージェント向けに提供するMC…
★ 1 MIT 2026-06-08
ASR / 音声認識
GitHub
ae-auto-subtitles
AED Subtitlesは、Adobe After Effects向けにDescriptスタイルのローカルWhisperキャプションを提供するツールです。…
★ 1 2026-06-15
動画生成
GitHub
multimodal-ai-content-pipeline
このツールは、単一のテキストプロンプトから、ポスター画像、ビデオクリップ、ナレーションを含むプロモーションコ…
★ 1 MIT 2026-06-10
ComfyUI
GitHub
comfyui-Colab
このGitHubリポジトリは、Google Colab上でComfyUIとQwen-Image-Editモデルを簡単に展開・実行するためのインタラク…
★ 1 ⑂ 1 2026-06-06
AIエージェント
GitHub
AgentLoopKit
AgentLoopKitは、Codex、Claude Code、Gemini CLIなどAIコーディングエージェントが生成したコードの品質と検証可能…
★ 1 MIT 2026-06-25
マルチモーダル
GitHub
ControlFoley_test
ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…
★ 1 Apache-2.0 2026-04-17
LLM
GitHub
laravelai
このツールは、LaravelアプリケーションにAIチャット機能を統合するためのSDKパッケージ「LaravelAI」です。Ollama、…
★ 1 MIT 2026-05-09
画像生成
GitHub
GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
マルチモーダル
GitHub
pdf2md_skill
「PDF2MD」は、Claude Codeスキルとして提供されるPDFからMarkdownへの変換ツールです。特にカスタムフォント、埋め…
★ 1 MIT 2026-06-07
音声生成 / TTS
GitHub
meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
LLM
GitHub
ollama-secure-gateway
このツールは、Ollamaサーバーとモバイル/ウェブアプリケーションを安全に接続するためのNode.js Expressミドルウェ…
★ 1 2026-06-18
音楽生成
GitHub
MAZ-MUSIC
MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…
★ 1 ⑂ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
Elderly-Care-Companion
Elderly Care Companionは、AIを活用した高齢者向けのヘルスアシスタントです。主な機能として、音声による症状記録…
★ 1 2026-06-09
画像生成
GitHub
windowed-minority-guidance
この研究は、拡散デノイジングにおける「マイノリティガイダンス」がどの時間ステップで効果を発揮するかを検証しま…
★ 1 2026-06-04
音声生成 / TTS
GitHub
RustyClaw
RustyClawは、Rustで実装されたClaude Code CLIで、コードベースの効率的なRAGインデックス作成、スマートなモデルル…
★ 1 Apache-2.0 2026-05-08
マルチモーダル
GitHub
control-sci
ControlMindは、MinerUを活用した科学文書インテリジェンスシステムです。生PDFから直接情報を抽出し、科学論文の理…
★ 1 NOASSERTION 2026-05-30