3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
lixaudio
LixAudioは、音声処理、音声認識(STT)、テキスト読み上げ(TTS)、セマンティック音声理解のためのモジュラーなPyt…
★ 1 ⑂ 1 GPL-3.0 2026-02-04
音声生成 / TTS
GitHub
sharky-ai-terminal
SHARKY AIは、アニメーション化されたネオンボイスオーブとハンズフリー音声チャット機能を備えた、ターミナル専用の…
★ 1 2026-06-14
動画生成
GitHub
swift-render
swift-renderは、SwiftUIとMetalシェーダーを用いてプログラムでモーショングラフィックスを生成し、MP4に出力するma…
★ 1 MIT 2026-06-15
3D / NeRF
GitHub
perceptpick
PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…
★ 1 MIT 2026-05-09
ComfyUI
GitHub
saya-comfy-couple-plus
「Saya Comfy Couple+」は、ComfyUIの既存のComfy Coupleノードを改良したものです。主に、2人以上のキャラクターが…
★ 1 2026-06-11
ASR / 音声認識
GitHub
voice-prompt-tool
「Voice Prompt Tool」は、Windows環境で動作する音声入力ツールです。ホットキーを押すだけで、任意のテキスト入力…
★ 1 2026-06-23
音声生成 / TTS
GitHub
AssistPlus
AssistPlusは、視覚、聴覚、発話に障害を持つユーザー、および一般的なアクセシビリティサポートを必要とするユーザ…
★ 1 2026-05-17
マルチモーダル
GitHub
ENOSES
「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…
★ 1 MIT 2026-05-17
ComfyUI
GitHub
ymstudio-ai-creator-os
YMSTUDIO AI Creator OSは、AI動画・コンテンツプロジェクトの企画をサポートするローカルファーストのクリエイター…
★ 1 MIT 2026-05-20
ASR / 音声認識
GitHub
kokkai-webtv-captions
「kokkai-webtv-captions」は、国立国会図書館の国会会議録が公式に公開されるまでの未収録期間を埋めるための個人用…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
PROSOPO
「Face AI」は、バイアス軽減に重点を置いた最先端の公平な顔認識システムです。顔検出、アライメント、埋め込み抽出…
★ 1 2026-05-22
動画生成
GitHub
LTX-2-Audio-to-Video-Local-XPU
このプロジェクトは、LTX-2 19B AIモデルを利用して、画像と音声トラックからビデオをローカルで生成するツールです…
★ 1 2026-03-20
動画生成
GitHub
seedance-movie-mcp
このツールは、Volcengine Ark Seedance/Jimengの動画生成サービスと連携するローカルのstdio MCPサーバーです。物語…
★ 1 MIT 2026-05-25
音声生成 / TTS
GitHub
ai-google-voice-agent
「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…
★ 1 2026-05-26
LLM
GitHub
rag-agent
このツールは、本番環境に対応したRAG(検索拡張生成)とAIエージェントプラットフォームです。高密度、BM25、RRFを…
★ 1 2026-05-26
LLM
GitHub
ontorag
ontoragは、RDF/OWLオントロジーを真の情報源として活用する、オントロジー対応RAG(Retrieval-Augmented Generation…
★ 1 ⑂ 1 MIT 2026-06-16
ASR / 音声認識
GitHub
stenographer
「stenographer」は、macOSネイティブの音声認識機能を活用したコマンドラインツールです。音声ファイルやライブマイ…
★ 1 2026-06-08
3D / NeRF
GitHub
project_slam_gs3lam
GS3LAMは、AIFLOW LABS LIMITEDが開発するANIMA Intelligence Compiler Suiteの一部であるGaussian Semantic SLAM(…
★ 1 2026-04-04
ASR / 音声認識
GitHub
TEL-Voice-Controlled-Smart-Home-Assistant
このツールは、モジュール式のスマートホームアシスタントシステムです。React製のモダンなウェブインターフェースと…
★ 1 2026-06-05
音楽生成
GitHub
Melodic-Intelligence-Layer
MIL(Melodic Intelligence Layer)は、ニューラルネットワークを使わずに数学理論に基づいたアルゴリズムによるピア…
★ 1 Apache-2.0 2026-04-05
ASR / 音声認識
GitHub
BaltiVoice-ASR
BaltiVoice ASRは、バルティ語(チベット語族の低リソース言語)の音声をテキストに変換する初のAI音声認識(ASR)シ…
★ 1 MIT 2026-06-12
画像生成
GitHub
f1-physics-engine
F1物理エンジンは、F1レースにおける車の動きを言語指示に基づいてビデオ生成するAIツールです。開始フレームと「急…
★ 1 ⑂ 1 MIT 2026-06-06
動画生成
GitHub
ai-avatar-video-generator
このツールは、スクリプトとアバターから音声同期されたトーキングヘッドビデオを生成するオープンソースのAIアバタ…
★ 1 ⑂ 1 MIT 2026-06-25
AIエージェント
GitHub
orchestrate-skill
「orchestrate」は、Claude Code向けの脳と身体のオーケストレーションスキルです。Claudeを主要な推論者(脳)とし…
★ 1 MIT 2026-06-13