使用8GB显存运行Hunyuan模型及ComfyUI更新

ComfyUI团队在最新发布的v0.3.10版本中,成功将HunyuanVideo模型的显存需求从32GB降低至8GB,使得更多用户能够在配置较低的GPU上运行该模型。 

什么是时间切片(Temporal Tiling)?

时间切片不同于空间切片。空间切片相对简单,因为在潜在空间和像素空间之间映射得很好。例如,对于8倍的空间压缩:1×1的潜在空间对应8×8的像素,2×1对应16×8的像素,4×4对应32×32的像素,依此类推。

而在时间维度上,对于4倍压缩:1个潜在空间对应1帧,2个潜在空间对应5帧,3个潜在空间对应9帧。其工作原理是每个时间潜在维度都会扩展到4倍,除了最后一个。

如何在低显存环境中启用时间切片?

  1. 将ComfyUI或ComfyUI Desktop更新至最新版本。
  2. 使用更新后的示例工作流。
  3. 在“VAE Decode(Tiled)”节点中,根据显存大小,尝试降低tile_size、overlap、temporal_size或temporal_overlap的值。
  4. 如果仍然出现内存不足的情况,或希望加快推理速度,请在“Load Diffusion Model”节点中选择fp8的weight_dtype。

此外,ComfyUI还新增了对PixArt模型的支持,包括Alpha和Sigma模型,支持不同分辨率(1024×1024和512×512)和格式,以及预训练权重。

如何使用PixArt模型?

  1. 将ComfyUI更新至最新版本。
  2. 下载以下模型文件:
    • Alpha权重或Sigma权重,并将其放置在ComfyUI/models/diffusion_models目录下。
    • 任意T5XXL模型,并将其放置在ComfyUI/models/text_encoders目录下。
    • 对于Alpha模型,下载SD1.5 VAE;对于Sigma模型,下载SDXL VAE,并将其放置在ComfyUI/models/vae目录下。
  3. 尝试示例工作流:PixArtSampleWorkflow.json。


已发布

分类

来自

标签: