3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#リアルタイム処理 (20 repos)
「リアルタイム処理」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub RealtimeSTT
RealtimeSTTは、音声アクティビティ検出、高速な文字起こし、リアルタイムテキスト更新、ウェイクワード機能を備えた…
★ 9.9k ⑂ 843 MIT 2026-06-12
ASR / 音声認識 GitHub speech-to-speech
Speech To Speechは、オープンソースモデルを活用してローカルで高度な音声エージェントを構築するためのプロジェク…
★ 4.9k ⑂ 584 Apache-2.0 2026-06-26
動画生成 GitHub HunyuanWorld-Voyager
HunyuanWorld-Voyagerは、カメラ入力に基づくインタラクティブなRGBDビデオ生成モデルで、リアルタイム3D再構築をサ…
★ 1.6k ⑂ 164 NOASSERTION 2026-04-15
画像生成 GitHub FluxRT
FluxRTは、FLUX.2-klein-4Bモデルを搭載し、消費者向けGPUに最適化されたリアルタイムストリーム編集パイプラインで…
★ 397 ⑂ 56 Unlicense 2026-06-13
マルチモーダル GitHub Awesome-VLM-Streaming-Video
このリポジトリは、Vision-Language Models (VLM) をストリーミングビデオに応用する研究と開発のための、厳選された…
★ 183 ⑂ 5 2026-06-10
ASR / 音声認識 GitHub Auris
Aurisは、人気ゲームGarry's Modのサーバー向けに開発されたリアルタイム音声文字変換ツールです。プレイヤーのボイ…
★ 33 ⑂ 5 MIT 2026-04-20
ASR / 音声認識 GitHub franken_whisper
franken_whisperは、Rust製の先進的な自動音声認識(ASR)オーケストレーションスタックです。whisper.cpp、insanely…
★ 33 ⑂ 3 NOASSERTION 2026-06-08
音声生成 / TTS GitHub claude-voice
このツールは、Claude CodeのAIチャットでClaudeの応答を音声で聞くための、完全にローカルなTTS(Text-to-Speech)…
★ 23 ⑂ 5 MIT 2026-06-15
ASR / 音声認識 GitHub silent-notetaker
「Silent Notetaker」は、ブラウザ内で完結するプライベートなAI会議メモ作成ツールです。音声を外部サーバーに送信…
★ 16 ⑂ 4 NOASSERTION 2026-06-16
ComfyUI GitHub ComfyUI-KittenTTS
ComfyUI-KittenTTSは、超軽量なKittenTTSテキスト読み上げモデルをComfyUIワークフローに統合するためのカスタムノー…
★ 10 ⑂ 3 Apache-2.0 2026-03-04
ComfyUI GitHub vibevoice.swift
VibeVoice.swiftは、macOSおよびLinux上でリアルタイム音声処理を実現するアプリケーションです。SwiftとMLXを活用し…
★ 9 ⑂ 1 MIT 2026-06-24
ASR / 音声認識 GitHub live-translation
Live Translationは、macOS上でシステムオーディオをリアルタイムでキャプション表示し、任意の言語へ翻訳して、半透…
★ 4 MIT 2026-06-25
ASR / 音声認識 GitHub universal_caption
Universal Captionsは、Groq Whisper APIを活用し、任意のChromeブラウザタブでリアルタイムの音声テキスト変換キャ…
★ 2 2026-06-10
ASR / 音声認識 GitHub voice-sentiment-streamlit
「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…
★ 2 2026-04-22
音声生成 / TTS GitHub NeuTTS-Studio
NeuTTS-Studioは、Windows向けのローカルテキスト読み上げアプリケーションです。デバイス上で入力されたテキストを…
★ 2 NOASSERTION 2026-06-23
3D / NeRF GitHub Ghost-Eye
Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU(ピーク時…
★ 1 Apache-2.0 2026-05-10
ASR / 音声認識 GitHub VoxCore
VoxCoreは、サブ秒の低遅延で動作するオープンソースのリアルタイム音声AIエンジンです。ASR(自動音声認識)、LLM(…
★ 1 ⑂ 1 Apache-2.0 2026-05-28
ASR / 音声認識 GitHub interview-copilot
「Real Time Interview Copilot」は、面接練習や模擬面接、自己レビューのために設計されたオープンソースのElectron…
★ 1 MIT 2026-06-09
マルチモーダル GitHub ENOSES
「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…
★ 1 MIT 2026-05-17
音声生成 / TTS GitHub speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17