AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?
幾天前,ChatGPT突然官宣免注冊,讓網(wǎng)友直呼AI取代搜索引擎的宏偉藍(lán)圖已經(jīng)拉開帷幕。
就像搜索引擎在2000年后逐漸成為了全世界互聯(lián)網(wǎng)的大門一樣,如今LLM的迅猛發(fā)展似乎也標(biāo)志著互聯(lián)網(wǎng)即將進(jìn)入Gen AI時(shí)代。
圖片
ChatGPT、Gemini、Copilot等AI工具,讓我們在線查詢和消費(fèi)的信息的方式,正在發(fā)生翻天覆地的變化。
??Perplexity和You.com??,已經(jīng)將自己定位為下一代搜索產(chǎn)品。連谷歌和必應(yīng),都押注AI是搜索的未來。
那么問題來了,AI大模型真的能取代搜索引擎嗎?
理論上,當(dāng)然存在這種可能。但前提是能夠做到以下兩點(diǎn):
1. 對于用戶的問題,能否找到相關(guān)、可信的來源,從而給出準(zhǔn)確的答復(fù)。
2. 對于用戶有時(shí)效性的問題,能否找到最新的來源。
現(xiàn)在國內(nèi)的各個(gè)大模型產(chǎn)品,能完成這兩項(xiàng)任務(wù)嗎?
話不多說,讓我們把這些AI拉出來遛遛,在各種搜索任務(wù)上,來一番實(shí)測PK。
LLM VS 搜索引擎
此次參與搜索競賽的,不僅有老牌搜索引擎,還有國外很火的模型A,以及國內(nèi)主流的大模型選手B、C、D。
賽事第一項(xiàng),考核的就是時(shí)效性。
我們先來問一個(gè)既隱含時(shí)間信息,表述又比較模糊的問題:「百度接下來會(huì)舉辦什么發(fā)布會(huì)么?」
顯然,傳統(tǒng)搜索引擎既不能準(zhǔn)確定位時(shí)間信息,也無法直接理解基于自然語言的提問。
小試一下就知道,傳統(tǒng)搜索會(huì)幫你刪減一些它認(rèn)為「不關(guān)鍵」的關(guān)鍵詞。
而模型A很快就找到了5個(gè)新聞地址,但由于無法識別當(dāng)前的時(shí)間信息,結(jié)果把百度去年舉辦的活動(dòng)搬了出來。
模型B的答案要更加完善,但同樣沒搞清楚時(shí)間,給出的是往屆發(fā)布會(huì)的信息。
模型C準(zhǔn)確識別出了小編提問的時(shí)間是在4月7日。
然后很輕松地將搜索的時(shí)間點(diǎn)卡在7日之后,并具體列出了接下來百度即將召開的三個(gè)會(huì)議。
不過,沒有參考連接這一點(diǎn),有些遺憾。
相比之下,模型D的答案就比較驚艷了。
它不僅回答準(zhǔn)確,而且最大的亮點(diǎn)是,在聯(lián)網(wǎng)搜索后給出了參考鏈接,能夠溯源驗(yàn)證信息。
內(nèi)容雖然相對簡潔,但精確回答了問題,也引用了完整的參考文獻(xiàn)
PK賽的第二項(xiàng),就是總結(jié)的完整度。
清明假期的一匹黑馬,就是宮崎駿的動(dòng)漫電影《你想活出怎樣的人生》了,剛剛票房已破了8.55億元。電影到底講什么了呢?
傳統(tǒng)搜索引擎只會(huì)搜什么,給什么,呈現(xiàn)了觀影評分、網(wǎng)友評價(jià),卻無法對影片進(jìn)行總結(jié)。
模型A則從主題內(nèi)涵和評價(jià)分歧兩方面進(jìn)行了分析,似乎更有條理。
不過,這里的參考鏈接「2」直接對應(yīng)的是「知乎登錄驗(yàn)證」,也不知道模型A最后是怎么繞過去的?
圖片
模型B則給出了3篇參考文章,以及更加豐富的回答。
但遺憾的是,它搞錯(cuò)了主角的名字——原著是叫「小哥白尼」,在電影中則是「牧真人」。
同樣,模型C也把主角在原著和電影里的名字給搞混了。
模型D在熟讀3篇文章之后,從影片的主旨核心,敘事風(fēng)格進(jìn)行了總結(jié)。
經(jīng)過小編的驗(yàn)證,所有參考鏈接也都可進(jìn)入查詢。
綜合能力如何?
從上面的PK中不難看出,模型D可以說是幾位選手里最有潛力的存在。
不過,正如文章開篇所提到的,大模型如果想「接替」搜索引擎,就必須能夠針對用戶的問題找到實(shí)時(shí)且正確的來源,并給出準(zhǔn)確的回答。
時(shí)效性
首先,在時(shí)效性方面,選手D可以精準(zhǔn)地搜出事件發(fā)生的時(shí)間。
比如,「探索一號」科考船圓滿完成首次中國-印度尼西亞爪哇海溝聯(lián)合深潛科考航次任務(wù)的時(shí)間是3月28日。
相關(guān)性
而在準(zhǔn)確性方面,選手D的表現(xiàn)尤為出色。
它不僅根據(jù)非常簡短的搜索詞「NAKAKITA招聘」,找到對應(yīng)的官網(wǎng)。
而且還能準(zhǔn)確地判斷出問題中的關(guān)鍵「招聘」,并對網(wǎng)站內(nèi)容進(jìn)行詳細(xì)的搜索。然后,進(jìn)一步給出了正確的結(jié)論——官網(wǎng)上沒有與招聘相關(guān)的內(nèi)容。
當(dāng)然,除了搜索能力之外,大模型到底好不好用,還需要全方位地考察一下才行——
文檔解析
話不多說,接下來我們就加大難度。
首先,上傳一個(gè)文檔,要求畫出折線圖,顯示連板變化,數(shù)據(jù)在文件中,x軸是日記,在開始畫的位置寫上股票名稱,每次發(fā)生變化都要寫。
原始數(shù)據(jù)
如此細(xì)節(jié)的要求,它都一一做到了,絲毫不差。
然后,再要求在另一份表格中空白的單元格中都填上1,它也圓滿完成了。
更多功能
此外,選手D在圖片生成、圖片描述、文字提取等多模態(tài)領(lǐng)域的表現(xiàn),也十分出色。
而最近大熱的智能體功能,它甚至可以完美支持PC、App和小程序三個(gè)入口。
到這里,我們就可以揭秘選手D的身份了,它就是——智譜清言。
來自國內(nèi)唯一一家全模型產(chǎn)品線對標(biāo)OpenAI的企業(yè)智譜AI。
大模型取代搜索引擎,可能性多高?
眾所周知,大模型相比于傳統(tǒng)搜索引擎有著更強(qiáng)的問題分析、歸納總結(jié)、理解和推理能力,讓我們不必再去研究需要使用哪些「關(guān)鍵詞」才能找到自己想要的內(nèi)容。
但卡脖子的地方在于,大模型訓(xùn)練數(shù)據(jù)的時(shí)效性。
ChatGPT雖然打開了認(rèn)知,讓AI模型更像大模型了,但它還并未用到實(shí)時(shí)搜索。
而國內(nèi)的這些模型,則給了我們更多希望。
當(dāng)大模型工具能夠整合先進(jìn)的數(shù)據(jù)抓取和整理能力時(shí),就能形成全新的搜索引擎鏈條:
首先AI會(huì)根據(jù)提問進(jìn)行需求分析-網(wǎng)頁搜索–答案歸納,然后通過自然語言對話的方式直接回答問題,從而實(shí)現(xiàn)與用戶更好地交互,而不僅僅提供一系列網(wǎng)站鏈接。
所以,現(xiàn)在AI大模型究竟離搜索引擎有多遠(yuǎn)呢,它們能殺死谷歌嗎?
讓我們從細(xì)處著眼。
當(dāng)我在討論搜索引擎的時(shí)候,我在討論什么?
這里貢獻(xiàn)一個(gè)冷知識:每年都有大量的人去谷歌搜索框中,輸入「谷歌」兩個(gè)字。
其實(shí),并沒有那么多人去谷歌上查找難以訪問的科學(xué)信息,但用它查找郵箱、購物網(wǎng)站的人,要多出幾個(gè)數(shù)量級。
或許,擺在這些潛在的谷歌殺手AI面前的問題,不是它們找到信息的能力,而是它們是否能做搜索引擎能做的一切。
1. 網(wǎng)站導(dǎo)航
其實(shí),搜索引擎的最主要工作,是把我們帶到一個(gè)網(wǎng)站。
Google上所有排名靠前的查詢,從「YouTube」到「Yahoo Mail」,都是導(dǎo)航查詢。
但AI機(jī)器人往往會(huì)思考幾秒鐘,然后提供一堆公司信息,但可能并沒有鏈接到Amazon之類的具體網(wǎng)站。
2. 信息查詢
對于體育比賽比分、現(xiàn)在幾點(diǎn)了之類的實(shí)時(shí)信息,谷歌都做對了,而AI工具往往都會(huì)過時(shí)(原因如上文所示)。
并且,谷歌往往會(huì)有關(guān)于你特定位置、背景的信息,而AI機(jī)器人很多都沒有。
當(dāng)然,如果查找「一年有多少周」這種問題,AI產(chǎn)品往往會(huì)給我們驚喜。
谷歌會(huì)回答:52.1429周。
而Perplexity和智譜清言則給出更加全面的答案——不僅分別考慮到了平年和閏年的情況,而且還給出了計(jì)算過程,非常清晰易懂。
3. 探索性查詢
「如何打領(lǐng)帶」、「為什么會(huì)發(fā)明電鋸」類似的問題,都屬于探索性的查詢。
這些問題往往沒有單一答案,而是學(xué)習(xí)過程的開端。
就比如,你在谷歌查找一位歌手,或者NASA歷史之類的問題,這時(shí)的你就是在探索。
這并不是人們使用谷歌的主要目的,但正是AI搜索工具大放異彩的時(shí)刻。
比如,針對「為什么發(fā)明電鋸」這一問題,Perplexity就會(huì)給出電鋸的醫(yī)療起源,并描述其技術(shù)演變過程,最終被伐木工人采用。
4. 參考鏈接引用
AI搜索工具最大的亮點(diǎn)之一,便是提供了引用來源的鏈接。
這意味著,如果用戶在搜索結(jié)果中發(fā)現(xiàn)了一個(gè)特別感興趣的事實(shí),可以點(diǎn)擊鏈接,進(jìn)入原始出處獲得進(jìn)一步了解。
總之,當(dāng)我們談起搜索引擎,最大的問題恐怕不在于技術(shù),而在于產(chǎn)品。
如果將以上問題一一解決,同時(shí)探索出合適的商業(yè)模式和結(jié)構(gòu),AI取代搜索引擎,應(yīng)該就不遠(yuǎn)了。
那時(shí),我們搜索時(shí)會(huì)出現(xiàn)的,不僅僅再是簡單的鏈接羅列,而是一個(gè)開門見山的準(zhǔn)確答案。
