AI視頻理解天花板,全新MiniGPT4-Video刷爆SOTA!寶格麗宣傳片配文一絕
幾天前,OpenAI官方賬號發(fā)布了第一支由Sora制作的MV——Worldweight,引全網(wǎng)圍觀。AI視頻,已然成為多模態(tài)LLM發(fā)展的大趨勢。然而,除了視頻生成,讓LLM對復(fù)雜視頻進行理解,也至關(guān)重要。最近,來自KAUST和哈佛大學(xué)的研究人員提出了MiniGPT4Video——專為視頻理解而設(shè)計的多模態(tài)大模型。論文地址:??https:arxiv.orgpdf2404.03413.pdf??值得一提的是,MiniGPT4Video能夠同時處理時態(tài)視覺數(shù)據(jù)和文本數(shù)據(jù),因此善于理解視頻的...