3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
voicelog
voicelogは、セルフホスト型のTelegramボイスジャーナルです。プライベートなTelegramボットに音声メッセージやテキ…
★ 3 MIT 2026-06-22
マルチモーダル
GitHub
kaggle-llm-server
このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。無料のKaggle …
★ 3 ⑂ 4 2026-05-24
LLM
GitHub
grounded-forge
grounded-forgeは、複雑で反復的な作業を行うための、ソースに基づいたアシスタントを構築・配布するためのリトリー…
★ 3 MIT 2026-05-20
画像生成
GitHub
OpenAI-PS
「OpenAI Photoshop Generator」は、Adobe Photoshop向けのオープンソースUXPプラグインです。このツールは、OpenAI…
★ 3 ⑂ 1 MIT 2026-06-04
マルチモーダル
GitHub
AI-Book-Discovery-App
Perspicuaは、図書館や書店での「選択のパラドックス」を解決するために設計された、高性能なAI駆動型セマンティック…
★ 3 GPL-3.0 2026-05-10
マルチモーダル
GitHub
reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-21
ASR / 音声認識
GitHub
Sirious
Siriousは、macOS上でローカルの音声コマンドのトランスクリプトを分類し、ルーティングする早期開発段階のアプリケ…
★ 3 NOASSERTION 2026-06-17
ComfyUI
GitHub
comfyui-mirror-panel
ComfyUI Mirror Panelは、ComfyUIの複雑なワークフローの操作性とパフォーマンスを大幅に向上させるプラグインです。…
★ 3 GPL-3.0 2026-05-05
ComfyUI
GitHub
ComfyUI-mflux-AnyModel
「ComfyUI-mflux-AnyModel」は、Apple Silicon(MLX/Metal)環境でComfyUIを使用して、あらゆるmflux/MLXモデルを実…
★ 3 ⑂ 1 MIT 2026-06-08
LLM
GitHub
financebench-rag-agent
本ツールは、役割ベースのアクセス制御を備えた金融文書Q&A向けマルチエージェントRAGシステムです。FinanceBenchで7…
★ 3 MIT 2026-06-09
音声生成 / TTS
GitHub
LetAITalk
LetAITalkは、AI音声アシスタントとしてユーザーに代わって電話に応答し、着信の意図を理解して安全な範囲で返答する…
★ 3 2026-05-14
動画生成
GitHub
controllable-prompt-guide
「可控提示詞向導」は、AI動画作成などのクリエイティブ作品向けにプロンプトを生成するツールです。専門用語の知識…
★ 3 MIT 2026-05-24
3D / NeRF
GitHub
TGS-SLAM
TGS-SLAMは、IEEE Robotics and Automation Letters (RA-L) に採択されたセマンティックRGB-D SLAMシステムです。本…
★ 3 2026-05-28
ASR / 音声認識
GitHub
scenelens
Scenelensは、Claudeにスマートな動画入力機能を提供するツールです。動画からシーン変化に基づいて最適なフレームを…
★ 3 MIT 2026-05-04
音声生成 / TTS
GitHub
MiniBox
MiniBoxは、GPT-SoVITSによる高品質な音声合成とクラウドLLMを組み合わせた、キャラクターボイスチャットボットです…
★ 3 ⑂ 2 MIT 2026-06-08
LLM
GitHub
PFD-toolkit
PFD Toolkitは、Future Death (PFD) レポートの収集、スクリーニング、テーマ発見といった手作業をAIで自動化し、構…
★ 3 ⑂ 1 AGPL-3.0 2026-06-22
3D / NeRF
GitHub
gaussian_lic_ros2
このツールは、LiDAR-Inertial-Camera Gaussian Splatting SLAMのROS2ネイティブポートであり、Gaussian-LIC/Gaussia…
★ 3 GPL-3.0 2026-06-21
動画生成
GitHub
awesome-seedance-2-prompts
このリポジトリは、Seedance 2.0のプロンプト、マルチモーダルAIビデオワークフロー、画像からビデオへの変換例、音…
★ 3 2026-04-28
音声生成 / TTS
GitHub
LocalVoiceTTS
LocalVoice TTSは、無料でローカル環境で動作するテキスト読み上げ(TTS)アプリケーションです。ユーザーは、ダイア…
★ 3 ⑂ 2 MIT 2026-05-30
画像生成
GitHub
Diffusion-Zero-to-Hero
本リポジトリは、拡散モデルをゼロから体系的に学ぶための中国語実践コースです。DDPM、DDIM、Hugging Face Diffuser…
★ 3 Apache-2.0 2026-05-21
ASR / 音声認識
GitHub
aftertalk
Aftertalkは、iPhone上で完全にオフラインで動作する会議記録アプリです。ネットワーク接続が一切不要で、会議の録音…
★ 3 MIT 2026-05-01
動画生成
GitHub
volcengine-hermes-plugin
このプラグインは、Hermes Agentに火山引擎(Volcengine)のDoubao LLM(大規模言語モデル)、Doubao Seedream(画像…
★ 3 ⑂ 1 2026-06-30
LLM
GitHub
provenance-energy-rag-chatbot
本ツールは、太陽光発電やエネルギー機器のマニュアルに対応した、信頼性の高いドキュメント指向型RAGチャットボット…
★ 3 MIT 2026-06-08
ASR / 音声認識
GitHub
hexy
HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…
★ 3 ⑂ 1 2026-05-10