微軟推出人工智能模型 CoDi,可互動和生成多模態內容
7 月 11 日消息,微軟近日發布新聞稿,推出了名為可組合擴散模型(CoDi),這是一種獨特的、基于可組合擴散的人工智能模型,其設計目標是互動和生成多模態內容。
微軟設計 CoDi 的目標,旨在解決傳統單一模態 AI 模型的局限性。以同步視頻和音頻為例,獨立生成的信息流拼接在一起時可能存在不一致和對齊的問題。
CoDi 采用了獨特的可組合生成策略,在擴散過程中對齊多模態,從而生成相互交織的模式,更重要的是,CoDi 能夠處理任意輸入模式并生成任意模態的內容。
CoDi 由 Microsoft Azure 認知服務研究團隊與北卡羅來納大學教堂山分校合作開發,也是 Microsoft 項目 i-Code 的一部分,該項目使用人工智能來增強人機交互。
IT之家在此附上 CoDi 項目官方介紹鏈接,感興趣的用戶可以深入閱讀。