3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub ai-google-voice-agent
「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…
★ 1 2026-05-26
ASR / 音声認識 GitHub voice_input_tool
本ツールは、Windows向けの軽量な音声入力アシスタントです。フローティングボタンのクリックで録音を開始・停止し、…
★ 1 MIT 2026-06-09
3D / NeRF GitHub pose-from-silhouette
このリポジトリは、CVPR 2026に採択された「Globally Optimal Pose from Orthographic Silhouettes」の公式MATLAB実…
★ 1 AGPL-3.0 2026-06-03
画像生成 GitHub vision-studio
Vision Studio-Xは、ローカル環境で動作するAIを活用した画像および動画生成用のプロフェッショナルなデスクトップア…
★ 1 MIT 2026-06-21
ASR / 音声認識 GitHub Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
3D / NeRF GitHub token-enhancer
Token Enhancerは、AIエージェントがWebページを読み込む際に、大量の無駄なトークンを消費する問題を解決するローカ…
★ 1 MIT 2026-06-25
音声生成 / TTS GitHub rvc-free-colab
rvc-free-colabは、古いGoogle Colab向けRVC学習ノートブックを、Python 3.12、numpy 2.x、torch 2.xといった最新のG…
★ 1 MIT 2026-06-02
3D / NeRF GitHub gsplat-mlx
gsplat-mlxは、Apple Silicon環境で3D Gaussian Splattingを高速に実行・開発するためのコアライブラリです。mlxのC+…
★ 1 MIT 2026-06-25
ASR / 音声認識 GitHub english-vocal-medical-terminology-mini
このリポジトリは、臨床文字起こしモデル、医療音声認識(STT)パイプライン、およびヘルスケア分野の会話型インター…
★ 1 NOASSERTION 2026-06-09
動画生成 GitHub multimodal-ai-content-pipeline
このツールは、単一のテキストプロンプトから、ポスター画像、ビデオクリップ、ナレーションを含むプロモーションコ…
★ 1 MIT 2026-06-10
ASR / 音声認識 GitHub slavex
「slaveX」は、3Dアパートにいるヒューマノイドに、音声やテキストで命令して自由に動かすことができるブラウザゲー…
★ 1 MIT 2026-06-11
LLM GitHub CodeFlowIQ
CodeFlowIQは、開発者が未知のコードベースを迅速に理解するのを助けるローカルファーストのリポジトリインテリジェ…
★ 1 MIT 2026-06-13
LLM GitHub seas
SEASとArgoは、AIの最前線で働くための補完的なシステムです。SEASはフロンティアのシグナルから「何が真実か」を探…
★ 1 NOASSERTION 2026-06-26
マルチモーダル GitHub easycomputewithgemma
このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン(iOS/Android)から自然言…
★ 1 2026-05-24
画像生成 GitHub seedream-4.5-api
APIDot経由のSeedream 4.5 APIは、ByteDance Seedの高度な画像生成・編集モデルSeedream 4.5を利用するためのプロダ…
★ 1 MIT 2026-05-25
音声生成 / TTS GitHub global-translation
このツールは、Googleの翻訳エンジンとMicrosoft Edge TTSを活用した、AI駆動型のリアルタイム言語翻訳アプリケーシ…
★ 1 2026-06-20
3D / NeRF GitHub UP.route
UP.routeは、ヴロツワフ生命環境科学大学の修士論文プロジェクトとして開発された3Dウェブジオポータルアプリケーシ…
★ 1 2026-06-26
LLM GitHub pdf-analyzer
このツールは、PDF文書の内容に基づいた質問応答を可能にするRAG(検索拡張生成)システムです。PDFをアップロードす…
★ 1 2026-05-14
動画生成 GitHub seedance-movie-mcp
このツールは、Volcengine Ark Seedance/Jimengの動画生成サービスと連携するローカルのstdio MCPサーバーです。物語…
★ 1 MIT 2026-05-25
3D / NeRF GitHub Multi-View-Fusion-Object-Detection-for-underwater-robotic-systems
このプロジェクトは、ROS2とYOLOv8を用いたリアルタイムの多視点融合オブジェクト検出システムです。複数のカメラか…
★ 1 2026-05-26
動画生成 GitHub comfyui-cinema-worldbuilder
Cinema Worldbuilderは、ComfyUI上でLTX 2.3ビデオ生成を強力に支援するカスタムノードパックです。このツールは、Ca…
★ 1 MIT 2026-05-20
ComfyUI GitHub MKRShift_Theme_Lab
Theme Labは、ComfyUI専用の全画面テーマワークスペースを提供する拡張機能です。このツールを使用すると、ComfyUIの…
★ 1 ⑂ 1 Apache-2.0 2026-04-05
画像生成 GitHub the_applied_ai_universe_coding_guide
このリポジトリは、「The Applied AI Universe」というAIの同心円状の分類法に基づいた2つの包括的なコーディングガ…
★ 1 2026-05-31
ASR / 音声認識 GitHub BaltiVoice-ASR
BaltiVoice ASRは、バルティ語(チベット語族の低リソース言語)の音声をテキストに変換する初のAI音声認識(ASR)シ…
★ 1 MIT 2026-06-12