隨著Sora的成功發(fā)布,視頻DiT模型得到了大量的關(guān)注和討論。設(shè)計(jì)穩(wěn)定的超大規(guī)模神經(jīng)網(wǎng)絡(luò)一直是視覺(jué)生成領(lǐng)域的研究重點(diǎn)。DiT[1]的成功為圖像生成的規(guī)模化提供了可能性。然而,由于視頻數(shù)據(jù)的高度結(jié)構(gòu)化與復(fù)雜性,如何將DiT擴(kuò)展到視頻生成領(lǐng)域卻是一個(gè)挑戰(zhàn),來(lái)自上海人工智能實(shí)驗(yàn)室的研究團(tuán)隊(duì)聯(lián)合其他機(jī)構(gòu)通過(guò)大規(guī)模的實(shí)驗(yàn)回答了這個(gè)問(wèn)題。早在去年11月,該團(tuán)隊(duì)就已經(jīng)開(kāi)源了一款與Sora技術(shù)相似的自研模型:Latte。作為全球首個(gè)開(kāi)源...
2024-04-07 11:13:15 4038瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
1.概述當(dāng)今電商領(lǐng)域,內(nèi)容營(yíng)銷(xiāo)的形式正日趨多樣化,視頻內(nèi)容以其生動(dòng)鮮明的視覺(jué)體驗(yàn)和迅捷高效的信息傳播能力,為商家創(chuàng)造了新的機(jī)遇。消費(fèi)者對(duì)視頻內(nèi)容的偏好驅(qū)動(dòng)了視頻創(chuàng)意供給的持續(xù)增長(zhǎng),視覺(jué)內(nèi)容作為連接消費(fèi)者和商品的橋梁,在廣告系統(tǒng)中正變得日益重要。然而,與傳統(tǒng)的圖文內(nèi)容相比,視頻內(nèi)容的制作難度和成本都要高得多。制作一個(gè)高質(zhì)量的視頻需要專(zhuān)業(yè)的技能、設(shè)備以及時(shí)間,這使得成品的質(zhì)量層次不齊,且難以批量化生...
2024-03-27 16:55:05 3740瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、業(yè)務(wù)背景隨著以O(shè)penAI為代表的AI生成式技術(shù)不斷突破,在萬(wàn)物皆可向量化的時(shí)代直接帶動(dòng)向量計(jì)算和存儲(chǔ)需求大幅提升,讓向量存儲(chǔ)和計(jì)算技術(shù)關(guān)注度達(dá)到新高,業(yè)界涌現(xiàn)出各類(lèi)向量數(shù)據(jù)庫(kù)。阿里媽媽擁有豐富的AI應(yīng)用場(chǎng)景,我們基于過(guò)去在向量引擎的積累和AI場(chǎng)景下需求,在近五年時(shí)間里不斷迭代升級(jí),沉淀出DolphinVectorDB,具有大規(guī)模、高性能、低成本且易開(kāi)發(fā)的優(yōu)勢(shì),在媽媽內(nèi)容風(fēng)控、營(yíng)銷(xiāo)知識(shí)問(wèn)答、達(dá)摩盤(pán)人群AI圈人和AI經(jīng)營(yíng)分...
2024-03-27 16:27:48 3544瀏覽 0點(diǎn)贊 0回復(fù) 0收藏