3,626 repos GH 3,511 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub parleq-speech
Parleqは、macOS向けのオープンソースで音声入力によるテキスト作成ツールです。グローバルホットキーで起動し、話し…
★ 1 Apache-2.0 2026-06-30
音声生成 / TTS GitHub tts-blendr
VoiceBlend-TUIは、Textualフレームワークで構築されたターミナルUI(TUI)アプリケーションです。テキストファイル…
★ 1 2026-04-29
ASR / 音声認識 GitHub resilient-stt
Resilient STTは、OpenAI互換のASR(自動音声認識)エンドポイントと連携し、音声ファイルを高精度にテキスト変換す…
★ 1 ⑂ 1 GPL-3.0 2026-06-25
動画生成 GitHub comfyui-cinema-worldbuilder
Cinema Worldbuilderは、ComfyUI上でLTX 2.3ビデオ生成を強力に支援するカスタムノードパックです。このツールは、Ca…
★ 1 MIT 2026-05-20
画像生成 GitHub anime-sd-mcp
anime-sd-mcpは、MCP(Model Context Protocol)サーバーとして機能し、AIクライアント(Claude Desktop、Claude Cod…
★ 1 MIT 2026-05-30
ComfyUI GitHub niren-drama
泥人剧场 (Niren Drama) は、縦型ショートドラマ制作に特化したフルスタックAIプラットフォームです。このツールは、…
★ 1 MIT 2026-06-02
LLM GitHub knowledge-project
Psycheは、Obsidianノート、書籍、ドキュメントに対応した、軽量で完全にオフライン動作するGraphRAGおよびRAGエンジ…
★ 1 ⑂ 1 MIT 2026-06-22
音声生成 / TTS GitHub Veynor
Veynorは、DiscordなどのAIエージェント向けにリアルタイム音声インタラクションを提供するオープンソースの音声ラン…
★ 1 MIT 2026-06-09
AIエージェント GitHub quant-research-lab
Quant Research Labは、AIを活用した6人のちび研究者が自律的に量子金融研究を行うアニメ風オフィスシミュレーション…
★ 1 MIT 2026-06-20
マルチモーダル GitHub ControlFoley_test
ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…
★ 1 Apache-2.0 2026-04-17
LLM GitHub laravelai
このツールは、LaravelアプリケーションにAIチャット機能を統合するためのSDKパッケージ「LaravelAI」です。Ollama、…
★ 1 MIT 2026-05-09
マルチモーダル GitHub -deepseek-skills
このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識(OCR機能を含む)と音声認識(…
★ 1 2026-06-04
音声生成 / TTS GitHub YOOS-APP
YOOS-APPは、ユーザー自身の執筆スタイルを学習し、その個性を保ったまま新しいコンテンツを生成するユニバーサルな…
★ 1 MIT 2026-06-05
マルチモーダル GitHub radscore
radscoreは、AI生成の放射線レポートを評価するための軽量なPythonツールキットです。BLEU、ROUGE、BERTScoreといっ…
★ 1 NOASSERTION 2026-06-16
画像生成 GitHub card-news-mcp
card-news-mcpは、テキストと背景画像からInstagramスタイル(720x720 PNG)の美しいカードニュースを自動生成するMC…
★ 1 MIT 2026-06-16
音楽生成 GitHub MAZ-MUSIC
MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…
★ 1 ⑂ 1 MIT 2026-06-15
ASR / 音声認識 GitHub Elderly-Care-Companion
Elderly Care Companionは、AIを活用した高齢者向けのヘルスアシスタントです。主な機能として、音声による症状記録…
★ 1 2026-06-09
画像生成 GitHub windowed-minority-guidance
この研究は、拡散デノイジングにおける「マイノリティガイダンス」がどの時間ステップで効果を発揮するかを検証しま…
★ 1 2026-06-04
音声生成 / TTS GitHub RustyClaw
RustyClawは、Rustで実装されたClaude Code CLIで、コードベースの効率的なRAGインデックス作成、スマートなモデルル…
★ 1 Apache-2.0 2026-05-08
マルチモーダル GitHub control-sci
ControlMindは、MinerUを活用した科学文書インテリジェンスシステムです。生PDFから直接情報を抽出し、科学論文の理…
★ 1 NOASSERTION 2026-05-30
ASR / 音声認識 GitHub Voxbee
Vox Beeは、Windows向けの無料オープンソース音声入力ソフトウェアです。whisper.cppを基盤とし、高速なローカル音声…
★ 1 GPL-3.0 2026-05-22
3D / NeRF GitHub nest
NeSTは、3D光弾性効果を活用して、透明な3Dオブジェクト内部に隠れた3D応力テンソル場を明らかにするための、物理学…
★ 1 ⑂ 2 MIT 2025-10-05
ComfyUI GitHub rave-culture-field-guide
「🍓 Rave Culture Field Guide」は、1960年代のacid testsから2026年の自律型DJに至るまで、レイブカルチャーの完全…
★ 1 NOASSERTION 2026-05-03
音声生成 / TTS GitHub podcastfy-saas
Podcastfy SaaSは、AIを活用してマルチモーダルなコンテンツ(URL、YouTube動画、PDF、画像、トピックなど)から多言…
★ 1 MIT 2025-10-24