3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
音声生成 / TTS GitHub AI-Video-Studio-2026-Automated-Video-Creation-with-Realistic-AI-Voice-85-Dialects
AI Video Studioは、最先端のAIを活用してプロフェッショナルな動画作成を自動化するオープンソースプラットフォーム…
★ 1 2026-06-18
3D / NeRF GitHub DNP-3DDMR-IR
本リポジトリは、2D臨床サーモグラフィ画像から乳房の3D形状再構築と熱マッピングを行うための多段階研究パイプライ…
★ 1 2026-06-23
音声生成 / TTS GitHub marmalade-tts-android
「marmalade-tts-android」は、オンデバイスのニューラルボイスと感情認識プロソディを搭載したAndroid向けテキスト…
★ 1 MIT 2026-06-18
動画生成 GitHub CLI-Anything
CLI-Anythingは、Windows環境のあらゆるアプリケーションをコマンドラインで操作可能にするツールです。GUI操作なし…
★ 1 2026-06-23
ComfyUI GitHub ComfyUI-lethris-dia2
このツールは、ComfyUI内で高品質なテキスト読み上げ(TTS)とキャプション生成を可能にするカスタムノードセットで…
★ 1 ⑂ 2 MIT 2025-12-12
3D / NeRF GitHub pose-from-silhouette
このリポジトリは、CVPR 2026に採択された「Globally Optimal Pose from Orthographic Silhouettes」の公式MATLAB実…
★ 1 AGPL-3.0 2026-06-03
画像生成 GitHub Folio
Folioは、AI生成画像や写真など、大量の画像コレクションを扱うユーザーのために開発された軽量なWindowsデスクトッ…
★ 1 ⑂ 1 MIT 2026-06-05
動画生成 GitHub hyperframes-motion-director
このHyperFrames Motion Directorは、記事、製品、ウェブサイトから映画のようなHyperFramesモーションビデオを作成…
★ 1 AGPL-3.0 2026-06-04
画像生成 GitHub diffusion-boltzmann-sampler
拡散ボルツマンサンプラーは、スコアベースの拡散モデルを用いてボルツマン分布からのサンプリングを加速する、統計…
★ 1 2026-06-25
マルチモーダル GitHub gaze
このツールは、AIにPC画面の「目」を与えるPython製アプリケーションです。ローカルで動作し、スクリーンショット、…
★ 1 MIT 2026-06-20
画像生成 GitHub amanuensis
amanuensisは、AIペルソナがMastodonやBlueskyで投稿を作成し、人間の承認を得てから公開するためのローカルファース…
★ 1 MIT 2026-06-25
動画生成 GitHub p-video-avatar-generator
「P-Video Avatar generator」は、PrunaAIのP-Video Avatarモデルを搭載した、無料のAIトークアバター動画生成デスク…
★ 1 ⑂ 1 MIT 2026-06-10
LLM GitHub agentguard
AgentGuardは、RAGやエージェントAIアプリケーション向けの自己ホスト型AI信頼性プラットフォームです。AIアプリケー…
★ 1 Apache-2.0 2026-06-18
ASR / 音声認識 GitHub funasr-whisper-api
このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…
★ 1 MIT 2026-06-14
LLM GitHub gha-repro-kit
gha-repro-kitは、失敗したGitHub Actionsの実行ログから、簡潔なレポートとローカルでの再現スクリプトを生成するCL…
★ 1 MIT 2026-06-15
音声生成 / TTS GitHub speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17
ASR / 音声認識 GitHub Sara-the-ai-assistant
S.A.R.A(Smart Autonomous Response Assistant)は、Pythonで構築された、JARVISにインスパイアされた完全音声制御…
★ 1 MIT 2026-06-29
音声生成 / TTS GitHub ComfyUI-Qwen3-TTS
ComfyUI-Qwen3-TTSは、テキストを音声に変換するシンプルなテキスト読み上げアプリケーションです。中国語、英語、日…
★ 1 2026-06-29
ASR / 音声認識 GitHub The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
画像生成 GitHub windowed-minority-guidance
この研究は、拡散デノイジングにおける「マイノリティガイダンス」がどの時間ステップで効果を発揮するかを検証しま…
★ 1 2026-06-04
音声生成 / TTS GitHub s2s
S2Sは、Rustとsherpa-onnxフレームワークを活用した、高性能で軽量なローカルSTT(音声認識)およびTTS(音声合成)A…
★ 1 GPL-3.0 2026-06-10
ASR / 音声認識 GitHub zox-ai
Zox AIは、OllamaとLlama 3.1 8Bモデルを基盤とした、完全にオフラインで動作するWindows向けのAIデスクトップアシス…
★ 1 NOASSERTION 2026-06-10
AIエージェント GitHub orcy
Orcyは、複数のAIコーディングエージェントが協調してタスクを遂行するためのオープンソースMCP(Multi-Agent Coordi…
★ 1 MIT 2026-06-24