3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-18
AIエージェント
GitHub
bug-bounty-hunting-agent
このツールは、AIを活用したバグバウンティハンティングのための包括的な知識ベースです。Matomo、Jetpack、WooComme…
★ 1 MIT 2026-05-13
ComfyUI
GitHub
overtli-studio-suite
overtli-studio-suiteは、ComfyUIユーザー向けの強力な拡張機能で、画像、ビデオ、音声、テキスト生成といった多様な…
★ 1 MIT 2026-06-28
音声生成 / TTS
GitHub
MyFreeSpeech-App-Reader
このツールは、PowerShellで構築された高機能なテキスト読み上げ(TTS)アプリケーション「My Free Speech Reader」…
★ 1 GPL-3.0 2026-05-17
ComfyUI
GitHub
Comfy_Storyboard
「ComfyUI Storyboard Workspace」は、ComfyUI向けのPureRef風ストーリーボード・リファレンスボード拡張機能です。…
★ 1 MIT 2026-04-13
LLM
GitHub
awesome-opd
「Awesome On-Policy Distillation」は、強化学習におけるOn-Policy Distillation (OPD) に関する厳選されたリソース…
★ 1 2026-05-15
ASR / 音声認識
GitHub
The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
音楽生成
GitHub
musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
ASR / 音声認識
GitHub
parleq-speech
Parleqは、macOS向けのオープンソースで音声入力によるテキスト作成ツールです。グローバルホットキーで起動し、話し…
★ 1 Apache-2.0 2026-06-30
動画生成
GitHub
3blue1brown
このプロジェクトは、自然言語の記述からAI(GPT-5.1 Codex Max)がManimコードを生成し、教育的なアニメーション動…
★ 1 2026-05-21
ComfyUI
GitHub
ComfyUI-Flux2KontextConditioner
ComfyUI-Flux2KontextConditionerは、ComfyUIのFlux2 Kontext - Klein画像編集ワークフローを強化する高度なコンディ…
★ 1 ⑂ 1 MIT 2026-06-01
ASR / 音声認識
GitHub
Recto
「Recto」は、macOSおよびiOSアプリケーション向けのスクリプト追跡エンジンです。音声認識技術を活用し、あらかじめ…
★ 1 MIT 2026-06-06
ASR / 音声認識
GitHub
realtime-voice-ai-platform
リアルタイム音声AI顧客サポートプラットフォームは、音声認識(STT)、音声合成(TTS)、マルチエージェントオーケ…
★ 1 MIT 2026-06-10
マルチモーダル
GitHub
vision-bridge-skill
「vision-bridge-skill」は、多モーダル対応ではないAIモデルに対し、画像、PDF、スクリーンショット、図表などの視…
★ 1 2026-06-11
画像生成
GitHub
ComfyUI-Mutantwork
ComfyUI-Mutantworkは、ComfyUI向けのカスタムノードスイートで、プロンプトの最適化、ローカルでのAI画像鑑識、およ…
★ 1 ⑂ 1 2026-06-12
音声生成 / TTS
GitHub
ha-car-spoken-alerts
このツールは、Home Assistant、Piper TTS、およびVLCを連携させ、Android Autoを介して車のスピーカーからプライバ…
★ 1 MIT 2026-06-13
AIエージェント
GitHub
Legion_runner
Legion Runnerは、RustとeBPFを用いて構築されたGitHub Actionsランナー向けのセキュリティ強化ツールです。CI/CDパ…
★ 1 MIT 2026-06-23
音声生成 / TTS
GitHub
codetalkie
Codetalkieは、Claude CodeやOpenAI CodexなどのAIコーディングエージェントのためのハンズフリー音声インターフェー…
★ 1 2026-06-21
音声生成 / TTS
GitHub
echotwin
EchoTwinは、Discordで利用できるAI音声ボットで、ユーザーの発言にクローンされた声でリアルタイムに返答します。Fi…
★ 1 MIT 2026-06-12
音声生成 / TTS
GitHub
Narracast
Narracastは、macOSユーザー向けのオフライン音声コンテンツ生成ツールです。任意のテキストを貼り付けるだけで、ク…
★ 1 MIT 2026-06-09
3D / NeRF
GitHub
perceptpick
PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…
★ 1 MIT 2026-05-09
3D / NeRF
GitHub
gaussian-splat-based-anomaly-detection
本ツールは、UAVで撮影した高層構造物(携帯電話基地局、風力タービン、電柱など)の画像を3D Gaussian Splatting (3…
★ 1 2026-05-17
動画生成
GitHub
seedance-movie-mcp
このツールは、Volcengine Ark Seedance/Jimengの動画生成サービスと連携するローカルのstdio MCPサーバーです。物語…
★ 1 MIT 2026-05-25