3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
LLM GitHub multi-agent-research-system
このマルチエージェントリサーチシステムは、ユーザーのクエリを受けて、ウェブから情報を収集・分析し、構造化され…
★ 1 ⑂ 1 2026-06-13
ASR / 音声認識 GitHub claude-baby
Claude Babyは、ハンズフリーで音声操作が可能なClaude Codeエージェントです。このツールはデスクトップペットとし…
★ 1 AGPL-3.0 2026-06-15
3D / NeRF GitHub TripoSplat
TripoSplatは、単一の2D画像から高品質な3Dガウスモデルを生成し、詳細な3D構造へと変換するツールです。アニメーシ…
★ 1 MIT 2026-06-26
音声生成 / TTS GitHub meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
音声生成 / TTS GitHub zotero-minimax-tts
「MiniMax SAPI5 TTS Bridge」は、クラウドまたはローカルのテキスト読み上げ(TTS)サービスが提供する音声を、Wind…
★ 1 MIT 2026-06-17
AIエージェント GitHub deepscene
DeepSceneは、オープンソースのビデオ-ストーリーボードCLIエージェントであり、低コストで動画の深い理解を実現しま…
★ 1 MIT 2026-05-14
ASR / 音声認識 GitHub carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
3D / NeRF GitHub Marble-x-Nuke
「Marble x Nuke」は、Nuke 17+にWorld Labs Marble APIを統合したツールです。コンポジターやVFXアーティストは、テ…
★ 1 MIT 2026-05-11
マルチモーダル GitHub ENOSES
「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…
★ 1 MIT 2026-05-17
LLM GitHub Conjugate-Purification-Dynamics
このリポジトリは、生成システムにおける「探索-利用」のジレンマを解決するための「共轭净化动力学 (CPD)」理論と、…
★ 1 MIT 2026-05-23
3D / NeRF GitHub comfyui-3D-viewport
ComfyUIワークフロー向けに設計された、ネイティブOpenGL 3Dビューポートです。物理カメラに忠実な表現が可能で、深…
★ 1 2026-05-15
ComfyUI GitHub rave-culture-field-guide
「🍓 Rave Culture Field Guide」は、1960年代のacid testsから2026年の自律型DJに至るまで、レイブカルチャーの完全…
★ 1 NOASSERTION 2026-05-03
音声生成 / TTS GitHub f5-tts-hotkey
このツールは、任意のアプリケーションで選択したテキストを、Alt+Xのホットキー操作でF5-TTSによる音声合成で読み上…
★ 1 2026-06-02
ASR / 音声認識 GitHub spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24
ASR / 音声認識 GitHub AI-Voice-Receptionist
AI Voice Receptionistは、Pythonで構築された完全なリアルタイム、フルデュプレックスのAI音声受付システムです。ロ…
★ 1 2026-06-04
マルチモーダル GitHub longitudinal-health-foundation-model
このリポジトリは、ウェアラブルデバイス、スマートフォン、気候データから得られる自己教師ありマルチモーダル情報…
★ 1 NOASSERTION 2026-05-21
ASR / 音声認識 GitHub ClearWord
ClearWordは、AIを搭載した会話回復エージェントであり、聴覚に困難を抱える人々が会話で聞き逃した部分を理解するの…
★ 1 MIT 2026-06-11
LLM GitHub rag-radar
RAG Radarは、新しいRAG(Retrieval-Augmented Generation)の実装、ツール、およびパターンをリアルタイムで追跡す…
★ 1 2026-06-26
3D / NeRF GitHub faster-trellis
「faster-trellis」は、Microsoftの「TRELLIS v1」における画像から3Dモデルへの変換を、学習不要で高速化するライブ…
★ 1 NOASSERTION 2026-06-11
ASR / 音声認識 GitHub hindsight
Hindsightは、macOS向けのプライベートでローカルファーストのセカンドブレインツールです。Macの画面から日中の作業…
★ 0 NOASSERTION 2026-06-25
動画生成 GitHub c5-video-agents
「Zian-anson/c5-video-agents」は、ユーザーの一言の要求から、画像、ナレーション、字幕、BGMを含む完全なMP4動画…
★ 0 ⑂ 1 MIT 2026-05-11
ASR / 音声認識 GitHub meeting-auto-summary
Meeting Auto Summaryは、会議の音声や動画を構造化された成果物(話者分離された文字起こし、字幕、要約、レポート…
★ 0 2026-06-04
画像生成 GitHub ComfyUI-Orakul-3K-Resolution
ComfyUI-Orakul-3K-Resolutionは、ComfyUIユーザー向けに、数学的な計算によるグリッチやアーティファクトを排除した…
★ 0 MIT 2026-05-20
画像生成 GitHub fooocus-zh-local-patch
このプロジェクトは、Fooocusの非公式な中国語ローカルUIパッチです。既存のFooocus環境にコピーして使用することで…
★ 0 NOASSERTION 2026-06-28