3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub Sirious
Siriousは、macOS上でローカルの音声コマンドのトランスクリプトを分類し、ルーティングする早期開発段階のアプリケ…
★ 3 NOASSERTION 2026-06-17
LLM GitHub dsm
DSM(Dynamic Segmented Memory)は、LLMが数百万トークンのデータセット上で推論することを可能にする、高性能なメ…
★ 3 MIT 2026-05-13
ASR / 音声認識 GitHub streamscribe
streamscribeは、クラウドやAPIキーに依存せず、通常のCPUで動作するリアルタイム放送転写・分析ツールです。複数の…
★ 3 2026-06-11
音声生成 / TTS GitHub awesome-audio-generation
このリポジトリは、AIによる音声生成技術(テキスト読み上げ、音楽生成、サウンドデザイン)に関する厳選されたAPI、…
★ 3 ⑂ 5 CC0-1.0 2026-06-17
画像生成 GitHub geometry-of-noise
このMarimoノートブックは、拡散モデルがなぜノイズレベルの条件付けを必要としないのかを、研究論文「The Geometry …
★ 3 2026-04-27
音声生成 / TTS GitHub seshat-tts
Seshat TTSは、Windows向けのGUIユーティリティで、ゲームやアプリケーション向けにリアルタイムの音声ストリーミン…
★ 3 ⑂ 1 NOASSERTION 2026-06-19
音楽生成 GitHub aeon-music-maker
aeon-music-makerは、テキスト記述からスタジオ品質の音楽を生成するCLIツールです。ACE Step 1.5 XLモデルを活用し…
★ 3 MIT 2026-07-01
マルチモーダル GitHub reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-21
LLM GitHub ring-fenced-rag
Ring-Fenced RAG (RFR)は、自己ホスト型でゼロトラストの検索拡張生成(RAG)システムです。特徴は、データベースレ…
★ 3 ⑂ 1 MIT 2026-06-23
3D / NeRF GitHub m3d_rocm
このプロジェクトは、Matrix-3DをAMDのROCmエコシステム向けに最適化した3D世界生成ツールです。テキストまたは画像…
★ 3 MIT 2026-06-19
LLM GitHub llm-observability-platform
この「LLM Observability Platform: Core Python Infrastructure」は、LLMアプリケーション向けに設計された高性能な…
★ 3 ⑂ 1 Apache-2.0 2026-07-02
ASR / 音声認識 GitHub claude-eyes
claude-eyesは、Claude Codeに動画処理能力を付与するためのプラグインです。主な機能として、ビデオ(URLまたはロー…
★ 3 NOASSERTION 2026-06-02
ComfyUI GitHub xenolith-graph
XenolithGraphは、AIネイティブでウェブに組み込み可能なノードグラフエディタです。Blueprintスタイルの型付きピン…
★ 3 MIT 2026-06-08
LLM GitHub mdrouter
mdrouterは、OpenAI、Ollama、Anthropicといった複数のLLMプロバイダーに対応したルーターです。低コスト、低遅延、…
★ 3 MIT 2026-06-21
音声生成 / TTS GitHub LocalVoiceTTS
LocalVoice TTSは、無料でローカル環境で動作するテキスト読み上げ(TTS)アプリケーションです。ユーザーは、ダイア…
★ 3 ⑂ 2 MIT 2026-05-30
マルチモーダル GitHub browserground
browsergroundは、ハイブリッドAIエージェント向けのローカルUIグラウンディングツールです。スクリーンショットとテ…
★ 3 2026-05-21
ASR / 音声認識 GitHub hexy
HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…
★ 3 ⑂ 1 2026-05-10
画像生成 GitHub gpt-image-2-skills
このツールは、Image2Studioが提供するGPT Image 2のプロンプト、画像リファレンス、視覚的な例を検索するためのエー…
★ 3 2026-04-30
ASR / 音声認識 GitHub MyPlayer
MyPlayerは、Windows専用のC++製メディアプレイヤーで、Qt 6、FFmpeg、CUDA、ONNX Runtimeを基盤としています。主な…
★ 3 MIT 2026-05-03
ASR / 音声認識 GitHub vocium
Vociumは、WindowsおよびmacOSで動作するデスクトップAI音声入力ツールです。ユーザーはショートカットキーを押して…
★ 3 MIT 2026-05-21
マルチモーダル GitHub LangSlice
LangSliceは、Vision-Language Model (VLM) を活用し、組織学的脳切片をBrainGlobeアトラスに自動で高精度に位置合わ…
★ 3 BSD-3-Clause 2026-06-03
動画生成 GitHub bernini-studio-ui
Bernini Studio UIは、ByteDanceの強力な画像・動画生成AIモデル「Bernini」の推論を、より操作しやすくするために開…
★ 3 Apache-2.0 2026-06-14
ComfyUI GitHub Xianxia_Studio
Xianxia Studioは、YouTube向け動画を100%オフラインで制作できるローカルAI映画制作スタジオです。テーマを入力する…
★ 3 Apache-2.0 2026-06-01
3D / NeRF GitHub msplat
msplatは、Apple Silicon搭載Mac向けに最適化された高速な3Dガウススプラッティングツールです。ユーザーはコーディ…
★ 3 Apache-2.0 2026-07-01