3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub showrunner
Showrunnerは、スクリプトからAI生成のUGC(User Generated Content)動画コンテンツを作成するためのオープンソース…
★ 3 ⑂ 1 MIT 2026-05-12
マルチモーダル GitHub AI-Book-Discovery-App
Perspicuaは、図書館や書店での「選択のパラドックス」を解決するために設計された、高性能なAI駆動型セマンティック…
★ 3 GPL-3.0 2026-05-10
音声生成 / TTS GitHub mellifluous
mellifluousは、Markdown形式のテキストを構造やインラインコンテンツを考慮し、自然な間合いで読み上げるツールです…
★ 3 MIT 2026-06-22
LLM GitHub whatifd
whatifdは、LLM(大規模言語モデル)システムにおけるプロンプト、モデル、ツールの変更がもたらす影響を客観的に評…
★ 3 ⑂ 1 Apache-2.0 2026-06-22
画像生成 GitHub sd-auto-negative
Auto Negative Promptは、Stable Diffusion WebUI reForgeおよびStable Diffusion Forge NEO向けの拡張機能です。こ…
★ 3 MIT 2026-06-14
画像生成 GitHub gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 3 MIT 2026-05-08
音楽生成 GitHub music-agent
music-agentは、ターミナル中心のワークフローのために設計されたオープンソースのAI音楽エージェントです。Hermesや…
★ 3 MIT 2026-04-16
ASR / 音声認識 GitHub pi-whisper-voice
「pi-whisper-voice」は、Piコーディングエージェント向けの音声入力ツールです。SPACEキーを長押しするだけで録音を…
★ 3 MIT 2026-04-27
音声生成 / TTS GitHub ovos-tts-plugin-kokoro
ovos-tts-plugin-kokoroは、Open Voice OS (OVOS) 音声アシスタント向けに開発された、多言語テキスト読み上げ(TTS…
★ 3 NOASSERTION 2026-05-03
ASR / 音声認識 GitHub claude-eyes
claude-eyesは、Claude Codeに動画処理能力を付与するためのプラグインです。主な機能として、ビデオ(URLまたはロー…
★ 3 NOASSERTION 2026-06-02
音声生成 / TTS GitHub fiona-anne
Fiona Anneは、プライバシーを最優先に考え、外部APIを一切使用せずに自身のマシン上で動作する、自己ホスト型の音声…
★ 3 2026-04-09
3D / NeRF GitHub lichtfeld-tensorboard-export
このツールは、LichtFeld Studio用のプラグインであり、トレーニング中の詳細なメトリクスをTensorBoardイベントファ…
★ 3 GPL-3.0 2026-05-15
ASR / 音声認識 GitHub WhisperCaption
WhisperCaptionはmacOS向けのリアルタイムキャプションアプリケーションです。マイク入力とMacのシステム音声を同時…
★ 3 MIT 2026-05-17
ASR / 音声認識 GitHub social-media-scraper-skill
このツールは、Instagram、TikTok、X (Twitter)、YouTubeといった主要ソーシャルメディアプラットフォームから、投稿…
★ 3 2026-07-02
ASR / 音声認識 GitHub Sirious
Siriousは、macOS上でローカルの音声コマンドのトランスクリプトを分類し、ルーティングする早期開発段階のアプリケ…
★ 3 NOASSERTION 2026-06-28
マルチモーダル GitHub LangSlice
LangSliceは、Vision-Language Model (VLM) を活用し、組織学的脳切片をBrainGlobeアトラスに自動で高精度に位置合わ…
★ 3 BSD-3-Clause 2026-06-03
動画生成 GitHub aigc-dashscope
「AI Chat Studio」は、AIによる創作活動を支援する軽量なツールです。OpenAI互換のチャット機能に加え、テキストや…
★ 3 2026-06-05
LLM GitHub dsm
DSM(Dynamic Segmented Memory)は、LLMが数百万トークンのデータセット上で推論することを可能にする、高性能なメ…
★ 3 MIT 2026-05-13
音声生成 / TTS GitHub awesome-audio-generation
このリポジトリは、AIによる音声生成技術(テキスト読み上げ、音楽生成、サウンドデザイン)に関する厳選されたAPI、…
★ 3 ⑂ 5 CC0-1.0 2026-06-17
画像生成 GitHub geometry-of-noise
このMarimoノートブックは、拡散モデルがなぜノイズレベルの条件付けを必要としないのかを、研究論文「The Geometry …
★ 3 2026-04-27
音声生成 / TTS GitHub seshat-tts
Seshat TTSは、Windows向けのGUIユーティリティで、ゲームやアプリケーション向けにリアルタイムの音声ストリーミン…
★ 3 ⑂ 1 NOASSERTION 2026-06-19
音楽生成 GitHub aeon-music-maker
aeon-music-makerは、テキスト記述からスタジオ品質の音楽を生成するCLIツールです。ACE Step 1.5 XLモデルを活用し…
★ 3 MIT 2026-07-01
マルチモーダル GitHub reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-21
LLM GitHub ring-fenced-rag
Ring-Fenced RAG (RFR)は、自己ホスト型でゼロトラストの検索拡張生成(RAG)システムです。特徴は、データベースレ…
★ 3 ⑂ 1 MIT 2026-07-03