Skip to content

ComfyUI-LTXLongAudio長尺音声チャンク、ネイティブループ、静止画動画プレビュー

アップロード UI から最終 MP4 出力まで、ComfyUI の表面をネイティブなまま保ちます。

ComfyUI-LTXLongAudio ロゴ

ビジュアルプレビュー

リポジトリヘッダー

ComfyUI-LTXLongAudio のワークフロー概要スクリーンショット

ComfyUI-LTXLongAudio

README の先頭では、この概要スクリーンショットをヘッダー画像として使っています。

アプリ画面

Frames Folder、Source Audio Upload、Segment Seconds、Random Seed を表示した ComfyUI-LTXLongAudio のアプリ画面

App mode 画面は、フレームフォルダ、音声アップロード、チャンク秒数、シードの 4 つに要点を絞っています。

同梱内容

  • 音声アップロード、画像アップロード、バッチフレーム、フォルダ選択のためのネイティブ入力ノード
  • セグメント計画、決定的フレーム選択、音声スライス、音声連結のための長尺音声ヘルパー
  • 同梱 LTX グラフで使うネイティブループ制御と補助ノード置換
  • samples/workflows/ 配下のスモークワークフローと、samples/input/ 配下の軽量サンプル画像群

サンプルの見どころ

同梱ワークフローの App mode 入力は最小限です。

App mode 入力用途
Frames Folderチャンクごとの静止画を選ぶフォルダを指定します。
Source Audio UploadComfyUI 上で元音声を直接アップロードします。
Segment Secondsチャンク長を指定します。既定値は 20 秒です。
Random Seedフレーム選択を再実行時も決定的に保ちます。

現在のワークフローは 3 groups / 9 nodes として解析され、App mode の最終出力ノードは 1 つです。

検証入口

  • uv run pytest
  • uv run python scripts/check_workflow_layout.py samples/workflows/LTXLongAudio_CustomNodes_SmokeTest.json --require-all-nodes-in-groups --require-app-mode
  • uv run python scripts/run_comfyui_api_smoke.py --workflow samples/workflows/LTXLongAudio_CustomNodes_SmokeTest.json --comfy-root /path/to/ComfyUI

TIP

run_comfyui_api_smoke.py の追跡済み既定値は ltx-demo-tone.wav です。ローカルに長い HOWL AT THE HAIRPIN2.wav があれば、それを優先しつつ追跡済みウィジェット名へコピーして使用します。

Built for practical long-audio ComfyUI workflows.