1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#音声処理 (7 repos)

「音声処理」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
guardian-sdk
Ethicore Engine™ — Guardian SDKは、Python製のLLMおよびエージェントアプリケーション向けの、リアルタイム脅威検…
★ 71 ⑂ 10 NOASSERTION 2026-05-22
マルチモーダル
HF
audio-flamingo-next-hf
Audio Flamingo Nextは、音声・環境音・音楽をまとめて理解できるNVIDIAの大規模音声言語モデルです。音声Q&A、文字…
❤ 48 ↓ 7.8k other 2026-04-15
音声生成 / TTS
GitHub
voice-agents-from-scratch
「Voice agents from scratch」は、Pythonでリアルタイム音声エージェントをゼロから構築するための実践的なチュート…
★ 25 ⑂ 3 MIT 2026-05-03
ComfyUI
GitHub
ComfyUI-LavaSR
ComfyUI-LavaSRは、高速な音声強調およびオーディオ超解像モデルであるLavaSRのためのComfyUIカスタムノードです。こ…
★ 9 ⑂ 2 MIT 2026-02-27
ComfyUI
GitHub
OpenShot-ComfyUI
OpenShot-ComfyUIは、人気動画編集ソフトOpenShot向けに開発されたComfyUIノードのセットです。OpenShotとAIモデルの…
★ 7 ⑂ 1 GPL-3.0 2026-04-16
マルチモーダル
GitHub
OmniMemo
OmniMemoは、MiMo V2.5 全スタックモデルを基盤とした多モーダル会議インテリジェントエージェントです。最大の特長…
★ 3 MIT 2026-05-21
音声生成 / TTS
GitHub
VoxKitchen
VoxKitchenは、生の音声録音をクリーンで検査可能なトレーニングデータセットに変換するための、宣言型音声データ処…
★ 2 Apache-2.0 2026-05-21