3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
ASR / 音声認識
GitHub
voxi
Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…
★ 1 MIT 2026-05-25
音楽生成
GitHub
story-to-music
このツールは、トルコ語のテキスト(物語、コンセプト、下書きなど)をSunoやUdioといった音楽生成AI向けの音楽プロ…
★ 1 MIT 2026-05-23
音声生成 / TTS
GitHub
tts-blendr
VoiceBlend-TUIは、Textualフレームワークで構築されたターミナルUI(TUI)アプリケーションです。テキストファイル…
★ 1 2026-04-29
画像生成
GitHub
the_applied_ai_universe_coding_guide
このリポジトリは、「The Applied AI Universe」というAIの同心円状の分類法に基づいた2つの包括的なコーディングガ…
★ 1 2026-05-31
ASR / 音声認識
GitHub
BaltiVoice-ASR
BaltiVoice ASRは、バルティ語(チベット語族の低リソース言語)の音声をテキストに変換する初のAI音声認識(ASR)シ…
★ 1 MIT 2026-06-12
AIエージェント
GitHub
cell-mem
Cell-memは、AIエージェント向けに脳にインスパイアされた多層的な永続メモリシステムです。作業記憶、エピソード記…
★ 1 MIT 2026-06-09
LLM
GitHub
docintel
DocIntelは、RAG(検索拡張生成)技術を用いたAIドキュメントインテリジェンスシステムです。PDF、DOCX、TXT、Markdo…
★ 1 2026-06-23
画像生成
GitHub
grok-image-mcp
「Grok Image MCP」は、xAIの画像生成・編集サービス「Grok Imagine」をAIコーディングエージェント向けに提供するMC…
★ 1 MIT 2026-06-08
画像生成
GitHub
Text-conversion-to-handwritten-pictures
このツールは、テキストを手書き風の画像に変換するGUIアプリケーションです。複数のフォントやページ選択オプション…
★ 1 2026-06-09
マルチモーダル
GitHub
invoice-extractor
この「Invoice Extraction System」は、VLM(Vision Language Models)を活用して、請求書や領収書から構造化された…
★ 1 2026-06-07
3D / NeRF
GitHub
telemetry-frame-mapper
本ツールは、DJIドローンで撮影された動画をGPS情報付きの3Dガウシアンスプラットへ変換する完全なパイプラインを提…
★ 1 MIT 2026-06-26
LLM
GitHub
pull-request-review
このツールは、GitHubのプルリクエストをAI(LLM)が自動的にレビューするGitHub Actionです。`codellama`などの指定…
★ 1 MIT 2026-06-18
音声生成 / TTS
GitHub
voxcpm2-pinokio-launcher
このツールは、トークナイザーフリーの多言語テキスト読み上げシステム「OpenBMB VoxCPM」を、Pinokioを通じて簡単に…
★ 1 2026-05-03
動画生成
GitHub
awesome-ai-fashion-video-prompts
このGitHubリポジトリは、ファッションブランド、アパレル販売業者、スタイリスト、クリエイター、Eコマースチーム向…
★ 1 2026-04-28
ASR / 音声認識
GitHub
Sara-the-ai-assistant
S.A.R.A(Smart Autonomous Response Assistant)は、Pythonで構築された、JARVISにインスパイアされた完全音声制御…
★ 1 MIT 2026-06-29
LLM
GitHub
Enterprise-RAG-Intelligence
Enterprise RAG Intelligenceは、ゼロトラスト検索、RBAC強制、および根拠に基づいた生成を提供するセキュアなエンタ…
★ 1 MIT 2026-05-31
ComfyUI
GitHub
mefaihomevideoai-worker
本リポジトリは、MEFAI画像から動画へのパイプラインにおけるホーム側のGPUワーカーです。クラウド上で画像から動画…
★ 1 Apache-2.0 2026-06-12
音声生成 / TTS
GitHub
marmalade-tts-android
「marmalade-tts-android」は、オンデバイスのニューラルボイスと感情認識プロソディを搭載したAndroid向けテキスト…
★ 1 MIT 2026-06-18
LLM
GitHub
rag-agent
このツールは、本番環境に対応したRAG(検索拡張生成)とAIエージェントプラットフォームです。高密度、BM25、RRFを…
★ 1 2026-05-26
音声生成 / TTS
GitHub
minimax-hub
このツールは、MiniMaxのAI生成機能をCodex CLIに統合するためのスキルです。画像生成、動画生成、音声合成(多言語…
★ 1 MIT 2026-05-29
3D / NeRF
GitHub
OptixGaussianRenderer
「OptixGaussianRenderer」は、NVIDIA OptiXフレームワークを用いてGaussian Splatsのレイトレーシングを実装したプ…
★ 1 GPL-3.0 2026-04-04
画像生成
GitHub
gpt-image-2
「GPT Image 2」は、OpenAIの最新画像生成モデルを基盤とした無料のAI画像生成ツールです。テキストプロンプトから写…
★ 1 MIT 2026-06-01