“國產Sora”Vidu全球上線 百度百舸提供視頻大模型訓練支持
7月30日,作為Sora全球首個挑戰者,且是國內首個純自研的視頻大模型Vidu(www.vidu.studio)正式上線。生數科技宣布,目前Vidu無需申請,用戶直接用郵箱注冊即可上手體驗。
生數科技作為國內最早布局多模態通用大模型的團隊之一,今年4月聯合清華大學發布了國內首款全面對標OpenAI Sora的視頻大模型Vidu。自4月底首次亮相以來,Vidu憑借媲美Sora的文生長視頻能力,迅速在國內外引起廣泛關注。此次Vidu全面開放了文生視頻、圖生視頻兩大功能,提供4s和8s兩種時長選擇,分辨率最高達1080P。
在效果上,Vidu不僅延續了四月份展示的高動態性、高逼真度、高一致性等優勢,還在上線版本中新增了角色一致性(Character To Video)、動漫風格、文字與特效畫面生成等特色能力。同時,在影響用戶體驗的推理速度層面,Vidu實現了業界最快的實測推理速度,生成一段4秒片段只需30秒。而市面上的主流AI視頻工具在生成4秒左右的視頻片段時,用戶通常需要等待1到5分鐘,甚至更長。 Vidu的高效推理不僅為用戶帶來了接近于無縫的創作體驗,更短的處理時間還意味著它能夠輕松應對大量用戶的需求,提供個性化的服務。
眾所周知,視頻生成產品的開發周期長且費用高昂。而從發布到上線僅僅三個月,生數科技就完成了對Vidu的快速迭代,實現了高質量的視頻生成效果,這離不開Vidu研發團隊在模型高效訓練方面積累的工程化經驗。密集而快節奏的模型訓練任務,不僅需要大規模的算力,還需要從數據準備到模型訓練、再到模型推理的全鏈路保障。
Vidu在模型訓練層面采用了百度百舸·AI異構計算平臺。百舸是百度智能云基于過去多年在 AI 方面的沉淀,以GPU為核心搭建的異構計算平臺,更適合大模型訓練,保障模型訓練的穩定性和效率。
在提升模型訓練效率方面,百舸可以把不同地點、不同規模、不同集群的算力統一管理起來,通過芯片性能優化、自動芯片選型、潮汐混部這些經驗和技術,大幅提升智能算力效能,萬卡集群上的模型有效訓練時長占比超過98.8%,線性加速比和帶寬有效性均超過了95%,是業界領先的算力效能。
在提升模型訓練穩定性方面,百舸提供了豐富的運維和可觀測工具以及容錯保障能力,提升了大規模集群長期運行的穩定性,降低因為故障導致訓推任務異常終止的概率,減少業務損失。
同時,百舸支持混合多芯,兼容昆侖芯、N騰、海光DCU、英偉達、英特爾等國內外主流AI芯片,支持同一智算集群中混合使用不同廠商芯片,最大程度上屏蔽硬件之間差異,幫助企業擺脫單一芯片依賴,實現更優的成本,保證更有彈性的供應鏈。在多芯混合訓練任務中,百舸能夠將單芯片利用率、芯片間通信效率、集群整體效能發揮到極致,百卡規模性能損失不超過3%,千卡規模性能損失不超過5%,均為國內領先水平。
百舸高效、穩定、混合多芯等特點能夠幫助生數科技實現大模型開發的“快、穩、省”,助力生數科技短時間低成本完成大模型的業務上線。目前,百舸已經在互聯網、教育、汽車、生命科學等行業有了廣泛的落地實踐,幫助行業客戶實現大模型應用的快速落地。
未來,生數科技將不斷基于百度百舸·AI異構算力計算平臺持續訓練、提升模型能力,并逐步通過百度智能云千帆平臺開放模型服務。