2,027 repos GH 1,912 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Hallo-Live

★ 112 ⑂ 16 MIT 更新: 2026-05-22 GitHubで見る →

概要

Hallo-Liveは、テキスト入力からリアルタイムでアバターのビデオと音声を生成する先進的なフレームワークです。

因果的デュアルストリームDiTモデルを用いることで、ビデオと音声を同期させながらストリーミング形式で出力します。

NVIDIA H200 GPUを2台使用した場合、20.38 FPSの高速処理と0.94秒という低遅延を実現し、高いリップシンク精度、視覚的忠実度、音声品質を両立しています。

ライブ配信、インタラクティブコンテンツ、バーチャルアシスタントなど、リアルタイムで高品質なアバター生成を必要とする開発者や研究者、コンテンツクリエイターに最適です。

HuggingFaceでモデルが公開されており、導入も比較的容易です。

互換性・特徴

  • リアルタイム
  • GPU必須
  • HuggingFace対応
  • 音声生成
  • 動画生成

基本情報

ライセンスMIT
Stars112
Forks16
カテゴリ画像生成
アクティビティmid

最新のissue

GitHub: https://github.com/fudan-generative-vision/Hallo-Live