3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#リアルタイム (33 repos)

「リアルタイム」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

VoxCPM

VoxCPM2は、OpenBMBが開発した、テキストを直接音声に変換するトークナイザーフリーの画期的なTTSシステムです。エン…

#GPU必須 #Python #Web UI

★ 31.1k ⑂ 3.5k Apache-2.0 2026-06-10

3D / NeRF

GitHub

FAST-LIVO2

FAST-LIVO2は、LiDAR、慣性計測ユニット、ビジュアルデータを融合し、高速かつ高精度な自己位置推定と環境マッピング…

#C++ #LiDAR #ROS

★ 4.2k ⑂ 758 GPL-2.0 2026-03-08

マルチモーダル

GitHub

parlor

Parlorは、Gemma 4 E2BとKokoroを搭載し、デバイス上でリアルタイムに動作するマルチモーダルAIです。音声と視覚を理…

#Linux (GPU対応) #macOS (Apple Silicon対応) #On-device AI

★ 1.8k ⑂ 226 Apache-2.0 2026-06-04

音声生成 / TTS

GitHub

my-translator

「My Translator」は、macOSおよびWindowsに対応したリアルタイム音声翻訳デスクトップアプリケーションです。システ…

#APIキー利用 #macOS #Windows

★ 1.2k ⑂ 384 MIT 2026-06-17

ASR / 音声認識

GitHub

LiveTranslate

LiveTranslateは、Windows向けのリアルタイム音声翻訳ツールです。システムオーディオとマイク入力をキャプチャし、A…

#CLI #GPU必須 #LLM連携

★ 361 ⑂ 32 MIT 2026-06-08

画像生成

GitHub

Hallo-Live

Hallo-Liveは、テキスト入力からリアルタイムでアバターのビデオと音声を生成する先進的なフレームワークです。因果…

#GPU必須 #HuggingFace対応 #リアルタイム

★ 275 ⑂ 44 MIT 2026-05-22

3D / NeRF

GitHub

MLSLabsGaussianSplattingRenderer-UE

MLSLabsRenderer-Liteは、MaLanShan Audio & Video Laboratoryが開発したUnreal Engine 5（UE5）向け高性能プラグイ…

#3DGS #4DGS #Unreal Engine 5.5

★ 217 ⑂ 25 Apache-2.0 2026-06-01

音声生成 / TTS

GitHub

kokoclone

KokoCloneは、Kokoro-ONNXを基盤とする高速な多言語音声クローンシステムです。短い音声サンプルからリアルタイムで…

#CLI #GPU対応 #Python

★ 148 ⑂ 24 Apache-2.0 2026-04-19

音声生成 / TTS

GitHub

personaplex-mlx

PersonaPlex-MLXは、NVIDIAのフルデュプレックス音声対音声モデル「PersonaPlex」をApple Silicon向けにMLXで移植し…

#Apple Silicon Mac #CLI #Hugging Face

★ 70 ⑂ 14 MIT 2026-02-18

3D / NeRF

GitHub

SplatRenderer-UEPlugin

Splat Rendererは、Unreal Engine 5.5以降向けの3D/4D Gaussian Splattingレンダラープラグインです。静的な3D Gauss…

#3Dレンダリング #Unreal Engine #Windows

★ 56 ⑂ 6 Apache-2.0 2026-04-05

ASR / 音声認識

GitHub

node-realtime-translator

このツールは、Node.jsを基盤とし、FFmpegでWindowsシステム音声をリアルタイムにキャプチャします。キャプチャされ…

#Node.js #Windows #デスクトップアプリ

★ 33 MIT 2026-05-11

音声生成 / TTS

GitHub

ElBruno.Realtime

「ElBruno.Realtime」は、.NET向けのプラグイン可能なリアルタイム音声会話フレームワークです。ローカルでVAD（音声…

#.NET #LLM #リアルタイム

★ 23 ⑂ 2 MIT 2026-05-05

ASR / 音声認識

GitHub

gigastt

gigasttは、GigaAM v3を搭載したロシア語専用のオンデバイス音声認識（STT）サーバーです。クラウドサービスやAPIキ…

#API #CLI #Rust

★ 11 ⑂ 1 NOASSERTION 2026-06-15

ASR / 音声認識

GitHub

「vo」はmacOS 26+およびApple Siliconデバイス向けのオンデバイス、リアルタイム文字起こし＆翻訳CLIツールです。ネ…

#Apple Silicon #CLI #macOS 26+

★ 8 MIT 2026-06-19

音声生成 / TTS

GitHub

gb-speech

「paladin-t/gb-speech」は、ゲームボーイ向けのリアルタイム音声シンセサイザーです。リアルな人の声ではなく、「ト…

#CLI #C言語 #Game Boy

★ 7 MIT 2026-05-03

マルチモーダル

GitHub

Multimodal-Edge-Node

Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…

#GPU必須 #Python #Web UI

★ 6 Apache-2.0 2026-05-01

音声生成 / TTS

GitHub

vocalis

Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…

#CLI #GPU必須 #LLM連携

★ 6 MIT 2026-05-21

音声生成 / TTS

GitHub

seshat-tts

Seshat TTSは、Windows向けのGUIユーティリティで、ゲームやアプリケーション向けにリアルタイムの音声ストリーミン…

#GUI #OCR #Python

★ 3 ⑂ 1 NOASSERTION 2026-06-19

音楽生成

GitHub

AuraDev

AuraDevは、開発者のリアルタイムの認知状態（集中、行き詰まり、デバッグなど）に適応してアンビエント音楽を生成す…

#AI #CLI #GCP

★ 3 GPL-3.0 2026-05-31

音声生成 / TTS

GitHub

crashout-buddy

Crashout Buddyは、Vision AgentsとStream Video上に構築された、リアルタイムで感情認識を行う音声AIエージェントの…

#CLI #Gemini対応 #Python

★ 3 MIT 2026-05-15

音声生成 / TTS

GitHub

LetAITalk

LetAITalkは、AI音声アシスタントとしてユーザーに代わって電話に応答し、着信の意図を理解して安全な範囲で返答する…

#AI #Go #Python

★ 3 2026-05-14

音声生成 / TTS

GitHub

Doppelvoice

Doppelvoiceは、リアルタイムで中国語・英語を含む9言語間の音声翻訳とゼロショット音声クローニングを提供するツー…

#GUI #Python #Windows

★ 2 ⑂ 1 MIT 2026-04-26

音楽生成

GitHub

strands-strudel

strands-strudelは、AIを活用したライブコーディング音楽ツールで、Strands Agentsのエコシステム内で動作します。リ…

#AI #CLI #Python

★ 2 2026-04-22

ASR / 音声認識

GitHub

speaknow

SpeakNowは、Windowsデスクトップ向けの軽量な音声入力ツールです。ホットキーを押して話すだけで、認識されたテキス…

#Python #Windows #デスクトップアプリケーション

★ 2 MIT 2026-04-22