概要
Python Autodubは、AIを活用した自動動画吹き替えパイプラインです。
音声抽出、Demucsによるボーカル分離、DiariZenによる話者分離、そしてF5-TTSによる翻訳された音声クローン生成を行い、これらをフレーム精度の高い方法で再構築し、最終的にMKV動画ファイルとして出力します。
本ツールは、長尺動画の処理におけるシステムRAMのOOMクラッシュを防ぐスマートチャンク処理や、複数の話者を自動識別する機能、人間が介入して音声クローンを編集できるUI、そしてオリジナル言語の漏洩や生成音声の不自然さを防ぐアンチハリネーション機能など、多くの高度な特徴を備えています。
Tkinterベースの使いやすいGUIも提供されており、NVIDIA GPU(8GB VRAM推奨)を持つユーザーが、手間をかけずに動画の吹き替えを効率的に行えるよう設計されています。
Hugging FaceトークンやAPIキーなしで、完全にオープンソースのモデルを利用できる点も特徴です。
互換性・特徴
- Python
- GUI
- CLI
- GPU必須
- オープンソース
- 翻訳機能
基本情報
| ライセンス | MPL-2.0 |
| Stars | 2 |
| Forks | 2 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
最新のissue
- オーディオミキシングとノーマライゼーション中に生成されるアーティファクト (更新: 2026-06-08 / Artifacts generated during audio mixing and normalization)
最新リリース: Python Autodub v2.2.1 (2026-03-14)
