ComfyUIがLTX-2.3にネイティブ対応　音声付き動画生成の品質向上とSNSの反応

ComfyUIは2026年3月6日、Lightricksの音声付き動画生成モデル「LTX-2.3」へのネイティブ対応を発表しました。

発表では、映像の細部表現、縦動画、音声品質、Image-to-Video、プロンプト理解、テキスト描画の改善が案内されています。

LTX-2.3のComfyUI対応で変わる点

LTX-2.3は、LTX-2系統を基盤にしたオープンソースの音声付き動画生成モデルです。

ComfyUIの公式ブログでは、ComfyUI上でLTX-2.3をネイティブに利用できるようになったと告知されました。

今回の更新では、映像品質と音声品質の両面で改良が入った形です。

対象には細部の描写、縦長動画、Image-to-Video、プロンプト理解、文字表現などが含まれます。

細部表現では、新しい潜在空間と更新済みVAEにより、質感や輪郭の精度向上が示されました。

9:16のポートレート動画についても品質改善が告知され、モバイル向けやSNS向けの縦動画制作を意識した内容です。

音声面では、ノイズ低減に加え、会話音声や音楽、環境音の明瞭化も挙げられました。

Image-to-Videoでは、動きの一貫性向上やフリーズしたフレームの減少が説明されています。

さらに、複雑な指示の解釈精度を高めるテキストエンコーダの改善と、動画内テキストの描画精度向上も案内されています。

案内された手順では、まずComfyUIをバージョン0.16.1へ更新します。

その後、Template Libraryで「LTX-2.3」を検索し、必要なワークフローを開く流れです。

必要モデルは画面の案内に従って取得できます。

入力素材やプロンプトを設定して実行すれば、Image-to-VideoやText-to-Videoの生成を始められる構成です。

公式案内では、Image-to-Video用とText-to-Video用のワークフローがそれぞれ配布されています。

加えて、Comfy Cloudから試せる導線も用意されました。

ローカル環境とクラウド環境の両方で試しやすい構成といえます。

Redditでは、LTX-2.3のネイティブ対応を歓迎する声が目立ちました。

特に、縦動画対応の改善や新モデル公開の速さを評価する投稿が見られます。

一方で、実運用面では必要容量の大きさやVRAM要件への懸念も出ていました。

既定ワークフローの構成や導入時エラーを指摘する声もあり、使い始めの分かりやすさには改善余地がある様子です。

縦長ポートレート動画の品質向上を歓迎する意見があり、SNS向け制作との相性を評価する反応が確認されました。

新しい創作ツールがそろってきたとして、制作意欲の高まりを語る投稿もあります。

公開直後からFP8版やGGUF版の情報共有が行われていた点も、コミュニティの活発さを示す動きです。

サンプル出力は厳選されているのではないかとして、ローカル環境の結果との差を疑問視する声がありました。

Image-to-Videoの破綻例を示し、物理表現や人体表現の不自然さを指摘する投稿も見られます。

また、43GB級の容量や12GB級VRAMへの言及があり、導入ハードルの高さも話題。

ComfyUI Desktop側の更新反映の遅れや、既定ワークフローでのエラー報告もあり、安定運用には環境差の確認が必要になりそうです。

参考リンク：