-
作者
-
發佈日期
2026-06-24
-
閱讀時間
6分鐘
-
字體大小
加州大學聖地牙哥分校 UCSD AI實驗室 Hao AI Lab 正式發布影片生成 AI 模型 FastWan-QAD。研發團隊透過名為「量化感知蒸餾」Quantization-Aware Distillation,QAD 技術,在 NVIDIA GeForce RTX 5090 顯示卡上僅需 1.78 秒便能生成一段 5 秒 480p 影片,較基礎模型 Wan2.1-T2V-1.3B 的 170 秒快足足 95 倍以上。
(1/5) 5 seconds of video. 1.8s seconds of generation. One NVIDIA GeForce RTX 5090 on FastVideo. 🤯🚀
– FastWan-QAD, a new family of video generation models
– Trained with FastVideo’s Quantization-Aware Distillation (QAD) recipe.
– Powered by FastVideo, we push a single NVIDIA… pic.twitter.com/zsyJiIEf3A— Hao AI Lab (@haoailab) June 23, 2026


▲在 NVIDIA GeForce RTX 5090 顯示卡上僅需 1.78 秒便能生成一段 5 秒 480p 影片 ( UCSD 郝AI實驗室截圖)
量化感知蒸餾技術
AI 模型加速通常依賴「量化」,即降低計算精度來縮短運算時間並減少記憶體佔用,但代價是影片質素下降。FastWan-QAD 的 QAD 方法以兩階段訓練應對這個問題,先進行量化感知微調 QAT,再執行量化感知的 DMD 蒸餾,將取樣步驟壓縮至僅 3 步,全程強迫模型在訓練中適應低精度帶來的誤差,從而在大幅加速的同時抑制質素劣化。
三款版本覆蓋不同硬件
FastWan-QAD 提供三個版本,各有特性:
FastWan-QAD-1.3B:量化至 NVFP4 精度,搭配 SageAttention3 FP4 後端,RTX 5090 上 1.78 秒生成 5 秒 480p 影片,訓練數據採用真實影片 Mixkit
FastWan-QAD-1.3B-SA2:同樣使用 NVFP4 線性層,但改用 SageAttention2++ 進行推理,RTX 5090 上約需 2 秒,質素較 SA3 版本更高,訓練數據採用 Wan2.1-14B 合成數據
FastWan-QAD-FP8-1.3B:專為不支援 FP4 tensor core 的上一代顯示卡設計,搭配 FP8 線性層及 SageAttention2++,RTX 4090 上可在 3.4 秒生成同等影片
影片質素表現
郝AI實驗室公告頁面提供與 TurboDiffusion TurboWan 及 LightX2V Wan-NVFP4 的對比影片,四款方法均在單張 RTX 5090 上生成 5 秒 480p 影片。整體而言,FastWan-QAD-1.3B 的生成質素與現有競爭方案相近,FastWan-QAD-1.3B-SA2 則被觀察到影片稍帶偏藍色調,用戶可按需求取捨速度與質素。

▲FastWan-QAD-1.3B-SA2 生成影片稍帶偏藍色調
開放使用
三款模型均已上架 Hugging Face,採用 Apache License 2.0 授權,研究人員及開發者可免費使用及修改。FastVideo 框架由 UCSD 郝AI實驗室主導開發,獲 NVIDIA 及 MBZUAI 支援,未來計劃將 QAD 技術擴展至更大規模的 Wan2.1-14B 及 NVIDIA Cosmos 2.5/3 系列模型。
資料來源:UCSD 郝AI實驗室