1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

SoviaMate

★ 1 Apache-2.0 更新: 2026-05-15 GitHubで見る →

概要

SoviaMateは、エンドツーエンドの音声対話システム(SDS)構築に向けたオープンな研究プロジェクトです。

特に、大規模言語モデル(LLM)との統合に特化したニューラルオーディオコーデック「SoviaMate-Codec」を提供しています。

このコーデックは、ASRデコーダによる言語情報の埋め込み、LLMへの連続特徴入力、ノイズに強い音声強調学習、話者適応による発話内容と話者の分離といった独自設計が特徴で、ゼロショットでの音声切り替えも可能です。

自然で制御可能な音声、実世界でのノイズ耐性、LLM統合を目指しており、音声対話システム、LLM統合、オーディオコーデックの研究開発を行う研究者や開発者が主な対象です。

互換性・特徴

  • Python
  • PyTorch
  • Hugging Face
  • CLI
  • 研究向け

基本情報

ライセンスApache-2.0
Stars1
カテゴリTTS / 音声
アクティビティlow

GitHub: https://github.com/samson-ailabs/SoviaMate