3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

LLM
GitHub
multi-agent-research-system
このマルチエージェントリサーチシステムは、ユーザーのクエリを受けて、ウェブから情報を収集・分析し、構造化され…
★ 1 ⑂ 1 2026-06-13
ASR / 音声認識
GitHub
claude-baby
Claude Babyは、ハンズフリーで音声操作が可能なClaude Codeエージェントです。このツールはデスクトップペットとし…
★ 1 AGPL-3.0 2026-06-15
3D / NeRF
GitHub
TripoSplat
TripoSplatは、単一の2D画像から高品質な3Dガウスモデルを生成し、詳細な3D構造へと変換するツールです。アニメーシ…
★ 1 MIT 2026-06-26
音声生成 / TTS
GitHub
meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
音声生成 / TTS
GitHub
zotero-minimax-tts
「MiniMax SAPI5 TTS Bridge」は、クラウドまたはローカルのテキスト読み上げ(TTS)サービスが提供する音声を、Wind…
★ 1 MIT 2026-06-17
AIエージェント
GitHub
deepscene
DeepSceneは、オープンソースのビデオ-ストーリーボードCLIエージェントであり、低コストで動画の深い理解を実現しま…
★ 1 MIT 2026-05-14
ASR / 音声認識
GitHub
carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
3D / NeRF
GitHub
Marble-x-Nuke
「Marble x Nuke」は、Nuke 17+にWorld Labs Marble APIを統合したツールです。コンポジターやVFXアーティストは、テ…
★ 1 MIT 2026-05-11
マルチモーダル
GitHub
ENOSES
「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…
★ 1 MIT 2026-05-17
LLM
GitHub
Conjugate-Purification-Dynamics
このリポジトリは、生成システムにおける「探索-利用」のジレンマを解決するための「共轭净化动力学 (CPD)」理論と、…
★ 1 MIT 2026-05-23
3D / NeRF
GitHub
comfyui-3D-viewport
ComfyUIワークフロー向けに設計された、ネイティブOpenGL 3Dビューポートです。物理カメラに忠実な表現が可能で、深…
★ 1 2026-05-15
ComfyUI
GitHub
rave-culture-field-guide
「🍓 Rave Culture Field Guide」は、1960年代のacid testsから2026年の自律型DJに至るまで、レイブカルチャーの完全…
★ 1 NOASSERTION 2026-05-03
音声生成 / TTS
GitHub
f5-tts-hotkey
このツールは、任意のアプリケーションで選択したテキストを、Alt+Xのホットキー操作でF5-TTSによる音声合成で読み上…
★ 1 2026-06-02
ASR / 音声認識
GitHub
spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24
ASR / 音声認識
GitHub
AI-Voice-Receptionist
AI Voice Receptionistは、Pythonで構築された完全なリアルタイム、フルデュプレックスのAI音声受付システムです。ロ…
★ 1 2026-06-04
マルチモーダル
GitHub
longitudinal-health-foundation-model
このリポジトリは、ウェアラブルデバイス、スマートフォン、気候データから得られる自己教師ありマルチモーダル情報…
★ 1 NOASSERTION 2026-05-21
ASR / 音声認識
GitHub
ClearWord
ClearWordは、AIを搭載した会話回復エージェントであり、聴覚に困難を抱える人々が会話で聞き逃した部分を理解するの…
★ 1 MIT 2026-06-11
LLM
GitHub
rag-radar
RAG Radarは、新しいRAG(Retrieval-Augmented Generation)の実装、ツール、およびパターンをリアルタイムで追跡す…
★ 1 2026-06-26
3D / NeRF
GitHub
faster-trellis
「faster-trellis」は、Microsoftの「TRELLIS v1」における画像から3Dモデルへの変換を、学習不要で高速化するライブ…
★ 1 NOASSERTION 2026-06-11
動画生成
GitHub
c5-video-agents
「Zian-anson/c5-video-agents」は、ユーザーの一言の要求から、画像、ナレーション、字幕、BGMを含む完全なMP4動画…
★ 0 ⑂ 1 MIT 2026-05-11
ASR / 音声認識
GitHub
meeting-auto-summary
Meeting Auto Summaryは、会議の音声や動画を構造化された成果物(話者分離された文字起こし、字幕、要約、レポート…
★ 0 2026-06-04
画像生成
GitHub
ComfyUI-Orakul-3K-Resolution
ComfyUI-Orakul-3K-Resolutionは、ComfyUIユーザー向けに、数学的な計算によるグリッチやアーティファクトを排除した…
★ 0 MIT 2026-05-20
画像生成
GitHub
fooocus-zh-local-patch
このプロジェクトは、Fooocusの非公式な中国語ローカルUIパッチです。既存のFooocus環境にコピーして使用することで…
★ 0 NOASSERTION 2026-06-28