Gemini 1.5實測:我看Sora一眼假;還有更多驚艷功能
谷歌の“反擊”來了!
Gemini被Sora搶走的風(fēng)頭,現(xiàn)在有搶回來的勢頭了。
在最新實測中,Gemini 1.5能分析Sora視頻是否AI生成。
是直接給出當(dāng)中關(guān)鍵因素的那種。
比如這個經(jīng)典的貓貓視頻,Gemini 1.5直言:
它的眼睛和毛都看起來都不像是真的。
還有像這段生成視頻,Gemini 1.5都能說出個一二三造假細(xì)節(jié)來~
都說魔法打敗魔法,結(jié)果Sora發(fā)布這才沒幾天,就火速被Gemini 1.5“抓出現(xiàn)行”。
對于Gemini 1.5第一波實測結(jié)果,網(wǎng)友直呼:that’s scary good,并稱其為“游戲規(guī)則的改變者”。
Gemini 1.5第一波實測來了
Gemini 1.5版本突然發(fā)布,結(jié)果被對面Sora的光芒所掩蓋。
但即便如此,其模型性能的重大升級,尤其是支持100萬token上下文窗口,仍讓網(wǎng)友們印象深刻。
現(xiàn)在一些博主陸陸續(xù)續(xù)地拿到了訪問資格,開始了第一波實測。
除了能鑒別生成視頻真假之外,還有這些令人印象深刻的功能。
1、分解并理解長視頻。
比如一場14分鐘的NBA扣籃視頻,Gemini 1.5能判斷出哪個扣籃得分最高, 并給出其中扣籃細(xì)節(jié)。
整個響應(yīng)過程大致只需要55秒左右。
2、理解長文本內(nèi)容,進(jìn)行比較分析。
博主投喂了《星際穿越》和《星際探索》兩個完整的電影腳本,合起來接近10萬tokens,要求Gemini 1.5分析比較,以幫助決定觀看哪部電影為好。
結(jié)果只需三十幾秒,就給出了完整詳盡的分析報告。
這樣一看,分析其中的劇情臺詞也就顯得小兒科了。
(分析電影中最鼓舞人心的三句話)
3、翻譯小語種。
即便是那種只有2000人左右使用的語言也能搞定,比如將英語翻譯成薩特蘭語。
除此之外,還有像分析理解論文中表格的細(xì)節(jié)。
對于這波實測,網(wǎng)友們都表示驚嘆:這是個巨大進(jìn)步,想說可能得等GPT-5來對抗。
尤其是能處理100萬Tokens上下文,這對GenAI初創(chuàng)公司很有用。
還有網(wǎng)友好奇谷歌是怎么解決上下文窗口大小問題的?
一定是發(fā)現(xiàn)或?qū)崿F(xiàn)了什么新東西。
網(wǎng)友:不太可能是巧合
不過對于谷歌這波“反擊”,暫且還未有OpenAI的人出來回應(yīng)。而此前Sora的發(fā)布,也少見有谷歌的人出來評價。
但兩家同一天發(fā)布,早就有網(wǎng)友浮想聯(lián)翩:
確實不太可能是巧合。
奧特曼不想失去谷歌這樣一個絕妙的炒作時機(jī)。
有網(wǎng)友認(rèn)為,Sora宣布顯然是一種營銷舉措,它還沒有準(zhǔn)備好。相比而言,Gemini 1.5 才是真正的突破。
但也有人認(rèn)為,Sora才真正意想不到。
Gemini 1.5 非常棒,但并不令人驚訝。
我非常有信心 OpenAI 內(nèi)部也有超過 100 萬個模型。(Sora是一個副項目)。
并且認(rèn)為GPT-5出來之后,會擊敗所有的競爭對手。
對于兩家這樣的操作,你怎么看呢?
One More Thing
兩家激戰(zhàn),受傷的是Adobe這類聚光燈之外的玩家。
這兩天股價簡直是一跌再跌……
而此前備受關(guān)注的視頻生成公司Runway,其聯(lián)合創(chuàng)始人回應(yīng):游戲開始了。
值得一提的是,此次國內(nèi)反應(yīng)跟ChatGPT那時候有點不一樣。
Sora出來之后,少見喊對標(biāo)的人,比當(dāng)時要安靜多了…