超纖巧本地 AI 影片製作模型 1.78秒極速生成 5 秒影片已開放免費下載

可愛浣熊在向日葵花田中.

作者
發佈日期

2026-06-24
閱讀時間

6分鐘
字體大小

加州大學聖地牙哥分校 UCSD AI實驗室 Hao AI Lab 正式發布影片生成 AI 模型 FastWan-QAD。研發團隊透過名為「量化感知蒸餾」Quantization-Aware Distillation，QAD 技術，在 NVIDIA GeForce RTX 5090 顯示卡上僅需 1.78 秒便能生成一段 5 秒 480p 影片，較基礎模型 Wan2.1-T2V-1.3B 的 170 秒快足足 95 倍以上。

(1/5) 5 seconds of video. 1.8s seconds of generation. One NVIDIA GeForce RTX 5090 on FastVideo. 🤯🚀

– FastWan-QAD, a new family of video generation models
– Trained with FastVideo’s Quantization-Aware Distillation (QAD) recipe.
– Powered by FastVideo, we push a single NVIDIA… pic.twitter.com/zsyJiIEf3A

— Hao AI Lab (@haoailab) June 23, 2026

夕陽下的樹林與行人.

可愛浣熊在向日葵花田中.

▲在 NVIDIA GeForce RTX 5090 顯示卡上僅需 1.78 秒便能生成一段 5 秒 480p 影片 ( UCSD 郝AI實驗室截圖)

量化感知蒸餾技術

AI 模型加速通常依賴「量化」，即降低計算精度來縮短運算時間並減少記憶體佔用，但代價是影片質素下降。FastWan-QAD 的 QAD 方法以兩階段訓練應對這個問題，先進行量化感知微調 QAT，再執行量化感知的 DMD 蒸餾，將取樣步驟壓縮至僅 3 步，全程強迫模型在訓練中適應低精度帶來的誤差，從而在大幅加速的同時抑制質素劣化。

三款版本覆蓋不同硬件

FastWan-QAD 提供三個版本，各有特性：

FastWan-QAD-1.3B：量化至 NVFP4 精度，搭配 SageAttention3 FP4 後端，RTX 5090 上 1.78 秒生成 5 秒 480p 影片，訓練數據採用真實影片 Mixkit

FastWan-QAD-1.3B-SA2：同樣使用 NVFP4 線性層，但改用 SageAttention2++ 進行推理，RTX 5090 上約需 2 秒，質素較 SA3 版本更高，訓練數據採用 Wan2.1-14B 合成數據

FastWan-QAD-FP8-1.3B：專為不支援 FP4 tensor core 的上一代顯示卡設計，搭配 FP8 線性層及 SageAttention2++，RTX 4090 上可在 3.4 秒生成同等影片

影片質素表現

郝AI實驗室公告頁面提供與 TurboDiffusion TurboWan 及 LightX2V Wan-NVFP4 的對比影片，四款方法均在單張 RTX 5090 上生成 5 秒 480p 影片。整體而言，FastWan-QAD-1.3B 的生成質素與現有競爭方案相近，FastWan-QAD-1.3B-SA2 則被觀察到影片稍帶偏藍色調，用戶可按需求取捨速度與質素。

多款AI影片生成模型展示.

▲FastWan-QAD-1.3B-SA2 生成影片稍帶偏藍色調

開放使用

三款模型均已上架 Hugging Face，採用 Apache License 2.0 授權，研究人員及開發者可免費使用及修改。FastVideo 框架由 UCSD 郝AI實驗室主導開發，獲 NVIDIA 及 MBZUAI 支援，未來計劃將 QAD 技術擴展至更大規模的 Wan2.1-14B 及 NVIDIA Cosmos 2.5/3 系列模型。

資料來源：UCSD 郝AI實驗室

超纖巧本地 AI 影片製作模型 1.78秒極速生成 5 秒影片 已開放免費下載

量化感知蒸餾技術

三款版本覆蓋不同硬件

影片質素表現

開放使用

超纖巧本地 AI 影片製作模型 1.78秒極速生成 5 秒影片已開放免費下載