3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音楽生成
GitHub
music-agent
music-agentは、ターミナル中心のワークフローのために設計されたオープンソースのAI音楽エージェントです。Hermesや…
★ 3 MIT 2026-04-16
ASR / 音声認識
GitHub
pi-whisper-voice
「pi-whisper-voice」は、Piコーディングエージェント向けの音声入力ツールです。SPACEキーを長押しするだけで録音を…
★ 3 MIT 2026-04-27
音声生成 / TTS
GitHub
ovos-tts-plugin-kokoro
ovos-tts-plugin-kokoroは、Open Voice OS (OVOS) 音声アシスタント向けに開発された、多言語テキスト読み上げ(TTS…
★ 3 NOASSERTION 2026-05-03
ASR / 音声認識
GitHub
claude-eyes
claude-eyesは、Claude Codeに動画処理能力を付与するためのプラグインです。主な機能として、ビデオ(URLまたはロー…
★ 3 NOASSERTION 2026-06-02
音声生成 / TTS
GitHub
fiona-anne
Fiona Anneは、プライバシーを最優先に考え、外部APIを一切使用せずに自身のマシン上で動作する、自己ホスト型の音声…
★ 3 2026-04-09
3D / NeRF
GitHub
lichtfeld-tensorboard-export
このツールは、LichtFeld Studio用のプラグインであり、トレーニング中の詳細なメトリクスをTensorBoardイベントファ…
★ 3 GPL-3.0 2026-05-15
ASR / 音声認識
GitHub
WhisperCaption
WhisperCaptionはmacOS向けのリアルタイムキャプションアプリケーションです。マイク入力とMacのシステム音声を同時…
★ 3 MIT 2026-05-17
ASR / 音声認識
GitHub
social-media-scraper-skill
このツールは、Instagram、TikTok、X (Twitter)、YouTubeといった主要ソーシャルメディアプラットフォームから、投稿…
★ 3 2026-07-02
ASR / 音声認識
GitHub
Sirious
Siriousは、macOS上でローカルの音声コマンドのトランスクリプトを分類し、ルーティングする早期開発段階のアプリケ…
★ 3 NOASSERTION 2026-06-28
マルチモーダル
GitHub
LangSlice
LangSliceは、Vision-Language Model (VLM) を活用し、組織学的脳切片をBrainGlobeアトラスに自動で高精度に位置合わ…
★ 3 BSD-3-Clause 2026-06-03
動画生成
GitHub
aigc-dashscope
「AI Chat Studio」は、AIによる創作活動を支援する軽量なツールです。OpenAI互換のチャット機能に加え、テキストや…
★ 3 2026-06-05
LLM
GitHub
dsm
DSM(Dynamic Segmented Memory)は、LLMが数百万トークンのデータセット上で推論することを可能にする、高性能なメ…
★ 3 MIT 2026-05-13
音声生成 / TTS
GitHub
awesome-audio-generation
このリポジトリは、AIによる音声生成技術(テキスト読み上げ、音楽生成、サウンドデザイン)に関する厳選されたAPI、…
★ 3 ⑂ 5 CC0-1.0 2026-06-17
画像生成
GitHub
geometry-of-noise
このMarimoノートブックは、拡散モデルがなぜノイズレベルの条件付けを必要としないのかを、研究論文「The Geometry …
★ 3 2026-04-27
音声生成 / TTS
GitHub
seshat-tts
Seshat TTSは、Windows向けのGUIユーティリティで、ゲームやアプリケーション向けにリアルタイムの音声ストリーミン…
★ 3 ⑂ 1 NOASSERTION 2026-06-19
音楽生成
GitHub
aeon-music-maker
aeon-music-makerは、テキスト記述からスタジオ品質の音楽を生成するCLIツールです。ACE Step 1.5 XLモデルを活用し…
★ 3 MIT 2026-07-01
マルチモーダル
GitHub
reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-21
LLM
GitHub
ring-fenced-rag
Ring-Fenced RAG (RFR)は、自己ホスト型でゼロトラストの検索拡張生成(RAG)システムです。特徴は、データベースレ…
★ 3 ⑂ 1 MIT 2026-07-03
動画生成
GitHub
Luma
Lumaは、AIを活用した動画コンテンツ自動制作プラットフォームです。スクリプトから音声生成、トーキングアバター動…
★ 3 2026-03-04
マルチモーダル
GitHub
langchain-content-normalizer
langchain-content-normalizerは、LangChain、MCPツール、Anthropicコンテンツブロック、およびマルチモーダルチャッ…
★ 3 MIT 2026-07-01
画像生成
GitHub
verbatim-flow
verbatim-flowは、macOS向けのシンプルかつ高精度なディクテーションアプリです。発話された言葉をそのままテキスト…
★ 3 MIT 2026-07-03
LLM
GitHub
AI-Procurement-Intelligence-System
「AI Procurement Intelligence System」は、企業向けに設計されたAI駆動型のマルチエージェント調達インテリジェン…
★ 3 MIT 2026-06-16
マルチモーダル
GitHub
vid2llm
vid2llmは、あらゆる動画からマルチモーダル言語モデル(LLM)向けのフレームを効率的に抽出するPythonツールキット…
★ 3 Apache-2.0 2026-06-23
LLM
GitHub
llm-observability-platform
この「LLM Observability Platform: Core Python Infrastructure」は、LLMアプリケーション向けに設計された高性能な…
★ 3 ⑂ 1 Apache-2.0 2026-07-02