3,069 repos GH 2,954 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Audio-Oscar

★ 32 ⑂ 3 Apache-2.0 更新: 2026-06-08 GitHubで見る →

概要

Audio-Oscarは、複雑な音声シーン記述から長尺で制御可能な音声を生成するためのマルチエージェントフレームワークです。

テキスト入力に基づき、複数のエージェントが連携してスピーチ、効果音、音楽、歌を組み合わせた音声シーンを生成し、意図したコンテンツとの整合性を高めます。

音声コンテンツ制作者や研究者が、詳細なコントロールのもとで高品質なオーディオコンテンツを生成するのに役立ちます。

また、音声シーン生成ベンチマーク「ASG-Bench」も提供しています。

互換性・特徴

  • Python
  • CLI
  • GPU必須
  • FFmpeg
  • マルチエージェント
  • LLM連携

基本情報

ライセンスApache-2.0
Stars32
Forks3
カテゴリ音声生成 / TTS
アクティビティlow

最新のissue

GitHub: https://github.com/ziye26/Audio-Oscar