InfiniteTalk 源码解析 #7:WanModel 改造:在视频扩散模型中加入音频条件控制
前一篇我们分析了 InfiniteTalkPipeline 的初始化过程。在那里,T5、CLIP、VAE、Wav2Vec2、WanModel 被串成了一条完整的视频生成链路:prompt → T5 → 文本条件
cond_video → CLIP → 图像条件
cond_video → VAE → latent 条件
audio → Wav2Vec2 → …
2026/7/1 18:42:21