3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#リアルタイム (33 repos)
「リアルタイム」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub VoxCPM
VoxCPM2は、OpenBMBが開発した、テキストを直接音声に変換するトークナイザーフリーの画期的なTTSシステムです。エン…
★ 31.1k ⑂ 3.5k Apache-2.0 2026-06-10
3D / NeRF GitHub FAST-LIVO2
FAST-LIVO2は、LiDAR、慣性計測ユニット、ビジュアルデータを融合し、高速かつ高精度な自己位置推定と環境マッピング…
★ 4.2k ⑂ 758 GPL-2.0 2026-03-08
マルチモーダル GitHub parlor
Parlorは、Gemma 4 E2BとKokoroを搭載し、デバイス上でリアルタイムに動作するマルチモーダルAIです。音声と視覚を理…
★ 1.8k ⑂ 226 Apache-2.0 2026-06-04
音声生成 / TTS GitHub my-translator
「My Translator」は、macOSおよびWindowsに対応したリアルタイム音声翻訳デスクトップアプリケーションです。システ…
★ 1.2k ⑂ 384 MIT 2026-06-17
ASR / 音声認識 GitHub LiveTranslate
LiveTranslateは、Windows向けのリアルタイム音声翻訳ツールです。システムオーディオとマイク入力をキャプチャし、A…
★ 361 ⑂ 32 MIT 2026-06-08
画像生成 GitHub Hallo-Live
Hallo-Liveは、テキスト入力からリアルタイムでアバターのビデオと音声を生成する先進的なフレームワークです。因果…
★ 275 ⑂ 44 MIT 2026-05-22
3D / NeRF GitHub MLSLabsGaussianSplattingRenderer-UE
MLSLabsRenderer-Liteは、MaLanShan Audio & Video Laboratoryが開発したUnreal Engine 5(UE5)向け高性能プラグイ…
★ 217 ⑂ 25 Apache-2.0 2026-06-01
音声生成 / TTS GitHub kokoclone
KokoCloneは、Kokoro-ONNXを基盤とする高速な多言語音声クローンシステムです。短い音声サンプルからリアルタイムで…
★ 148 ⑂ 24 Apache-2.0 2026-04-19
音声生成 / TTS GitHub personaplex-mlx
PersonaPlex-MLXは、NVIDIAのフルデュプレックス音声対音声モデル「PersonaPlex」をApple Silicon向けにMLXで移植し…
★ 70 ⑂ 14 MIT 2026-02-18
3D / NeRF GitHub SplatRenderer-UEPlugin
Splat Rendererは、Unreal Engine 5.5以降向けの3D/4D Gaussian Splattingレンダラープラグインです。静的な3D Gauss…
★ 56 ⑂ 6 Apache-2.0 2026-04-05
ASR / 音声認識 GitHub node-realtime-translator
このツールは、Node.jsを基盤とし、FFmpegでWindowsシステム音声をリアルタイムにキャプチャします。キャプチャされ…
★ 33 MIT 2026-05-11
音声生成 / TTS GitHub ElBruno.Realtime
「ElBruno.Realtime」は、.NET向けのプラグイン可能なリアルタイム音声会話フレームワークです。ローカルでVAD(音声…
★ 23 ⑂ 2 MIT 2026-05-05
ASR / 音声認識 GitHub gigastt
gigasttは、GigaAM v3を搭載したロシア語専用のオンデバイス音声認識(STT)サーバーです。クラウドサービスやAPIキ…
★ 11 ⑂ 1 NOASSERTION 2026-06-15
ASR / 音声認識 GitHub vo
「vo」はmacOS 26+およびApple Siliconデバイス向けのオンデバイス、リアルタイム文字起こし&翻訳CLIツールです。ネ…
★ 8 MIT 2026-06-19
音声生成 / TTS GitHub gb-speech
「paladin-t/gb-speech」は、ゲームボーイ向けのリアルタイム音声シンセサイザーです。リアルな人の声ではなく、「ト…
★ 7 MIT 2026-05-03
マルチモーダル GitHub Multimodal-Edge-Node
Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…
★ 6 Apache-2.0 2026-05-01
音声生成 / TTS GitHub vocalis
Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…
★ 6 MIT 2026-05-21
音声生成 / TTS GitHub seshat-tts
Seshat TTSは、Windows向けのGUIユーティリティで、ゲームやアプリケーション向けにリアルタイムの音声ストリーミン…
★ 3 ⑂ 1 NOASSERTION 2026-06-19
音楽生成 GitHub AuraDev
AuraDevは、開発者のリアルタイムの認知状態(集中、行き詰まり、デバッグなど)に適応してアンビエント音楽を生成す…
★ 3 GPL-3.0 2026-05-31
音声生成 / TTS GitHub crashout-buddy
Crashout Buddyは、Vision AgentsとStream Video上に構築された、リアルタイムで感情認識を行う音声AIエージェントの…
★ 3 MIT 2026-05-15
音声生成 / TTS GitHub LetAITalk
LetAITalkは、AI音声アシスタントとしてユーザーに代わって電話に応答し、着信の意図を理解して安全な範囲で返答する…
★ 3 2026-05-14
音声生成 / TTS GitHub Doppelvoice
Doppelvoiceは、リアルタイムで中国語・英語を含む9言語間の音声翻訳とゼロショット音声クローニングを提供するツー…
★ 2 ⑂ 1 MIT 2026-04-26
音楽生成 GitHub strands-strudel
strands-strudelは、AIを活用したライブコーディング音楽ツールで、Strands Agentsのエコシステム内で動作します。リ…
★ 2 2026-04-22
ASR / 音声認識 GitHub speaknow
SpeakNowは、Windowsデスクトップ向けの軽量な音声入力ツールです。ホットキーを押して話すだけで、認識されたテキス…
★ 2 MIT 2026-04-22