告別800秒魔咒!硬件級STA革新視頻DiT注意力,讓HunyuanVideo效率提升3.5倍!
論文鏈接:https:arxiv.orgpdf2502.04507Git鏈接:https:github.comhaoailabFastVideoHuggingface:https:huggingface.coFastVideoFastHunyuan亮點直擊識別并量化了最先進的視頻DiT中的3D局部性和頭部specialization,揭示了完整3D注意力中的大量冗余。引入了SLIDINGTILEATTENTION,一種基于分塊的滑動窗口注意力機制。優化內核與FlashAttention3相比實現了最小的開銷,MFU達到58.79%。STA將注意力加速超過10倍,并將端到端視頻...