ChatGPT還在2G沖浪?新模型「youChat」:我已能夠解說2022世界杯
ChatGPT 自推出以來就被寄予厚望,一些人認為它會取代搜索引擎,成為「改變游戲規則的人」。
真的會有這一天嗎?至少,一部分業內人士已經啟動了頗具挑戰性的落地試驗。
今天,搜索引擎 You.com 公司 CEO Richard Socher 在推特宣布,「youChat」已經正式上線。
新的試用功能已經發布在 You.com 搜索引擎的首頁:
「我們非常高興今天推出 youChat v1。這僅僅是個開始。我們將很快發布具有更多獨特功能的改進版本?!鼓壳?,youChat 以測試版的形式發布。
youChat 具有與 ChatGPT 類似的功能,用戶可以在搜索引擎的「Chat」選項欄進行對話:
如果你問 youChat:誰是這個世界上最美麗的女人?答案可不是白雪公主。它會告訴你是 Yael Shelbia,而且還會解釋為什么是她:
面對「誰贏得了這屆世界杯」的提問,數據庫比較滯后的 ChatGPT 答不上來。但 youChat 答對了,還解釋了一番:
關于「梅開二度」,youChat 還能進行一次盤點:
在移動設備上,用戶也可以通過 [http://you.com/chat] 聊天。當前,這個鏈接也可在桌面上使用,但僅顯示聊天,而沒有任何其他應用程序或鏈接。
youChat 怎么用
與一般搜索引擎不同的是,youChat 了解最近發生的事件,并可以為其答案提供引用。
比如:「誰是推特公司的 CEO?」youChat 給的答案是「馬斯克」,同時也會告訴你,近來的推特都發生了什么。
ChatGPT 的數據庫似乎還停留在過去的某一天。對于同樣的問題,ChatGPT 的答案是:
Richard Socher 表示,通過 youChat,他們希望解決搜索中的兩方面的問題:讓搜索更直觀、更有幫助、更快,以及讓大型語言模型更可靠。
youChat 會像 AI 助手一樣響應用戶的提示,讀取、寫入和匯總信息。這顛覆了用戶從搜索引擎獲取結果的方式:
首先,通過易于理解的句子獲得信息,而不是鏈接列表:
其次,理解復雜的概念:
此外,還可以獲取有關圣誕禮物、論文大綱或編程之類問題的 idea:
用戶測評:「差點意思」
在發布的同時 Richard Soche 還表示:「我們將在 2023 年徹底改變人們對搜索引擎的看法。」不過,youChat 即使比其他大型語言模型更經常更新和更真實,也仍然會出錯。
發布之后,一些用戶立刻指出了 youChat 的不足:「這是我的第一個問題。它甚至不知道今年是什么?!?/span>
特斯拉今年的最低股價是多少?
Richard Socher 的回復是:「對于此類查詢,我會使用搜索引擎的主要應用程序和結果,例如參閱中心底部,這將提供準確的答案。我們很快就會合并這些類型的應用程序?!?/span>
看起來,提問的「措辭」很重要:
另一位用戶則提問:「曼聯下一場比賽是什么時候?」youChat 答:「2022 年 1 月 15 日。」
這位用戶真誠地建議:「是時候讓它停止產生幻覺了?!?/span>
問答模型爆火之后
ChatGPT 能在 2022 年底成為 AI 界頂流,是因為它掌握廣泛的基本知識,特別是在編程方面,甚至有人認為 ChatGPT 將取代搜索引擎。
據外媒 VentureBeat 報道,在 Forrester 公司分析師 Rowan Curran 看來,生成式 AI 此刻面臨的時機至關重要:「我唯一能夠比較的是 iPhone 的發布。蘋果公司的 iPhone 不是第一款智能手機,但它以其觸摸屏、易用性和引入的應用程序埋葬了競爭對手,將完整的計算體驗放進了人們的口袋?!?/span>
短短幾天就涌入了百萬數量級的用戶,的確驗證了 ChatGPT 的受歡迎程度。另一方面,ChatGPT 也在改變公眾對可能性的認知。
作為一個問答語言模型,ChatGPT 首先以出色的回答給人以深刻的印象。比如,它可以和人們就「現代物理學的發展史」高談闊論 20 分鐘:
詢問計算機相關的知識,更是對答如流,例如解釋正則表達式的含義:
在編程方面,ChatGPT 還能自動寫程序,找 bug:
關于 ChatGPT 是否會取代現有的搜索引擎,我們需要分析一下 ChatGPT 的能力和短板。盡管作為一個語言模型,它能夠給出邏輯清晰,又不乏知識性的回答,但不是所有的回答都是完全正確的。
上線幾天之后,Stack Overflow 就宣布封禁了 ChatGPT,原因是 ChatGPT 生成的答案錯誤率很高,并且錯誤不容易發現。這會給使用 Stack Overflow 查詢編程問題的用戶帶來非常大的困擾。
我們知道,搜索引擎能被廣泛接受和使用,除了它方便快速,更重要的是搜索到的信息正確率是很高的,并且一些百科網站也在不斷完善知識的覆蓋面和準確性,這需要大量的人工校對和專業知識。而 ChatGPT 等 AI 語言模型的現狀是生成功能強大,但知識的準確性很難有保證。
知識型模型是近期學術界和業內努力探索的一個方向。人們希望未來的 AI 是掌握大量科學知識的,進而實現通用人工智能(AGI)。但從目前的工作看,構建知識型模型還差得很遠。例如,前段時間 Meta 的模型 Galactica 上線僅兩天就火速下架,因為該模型生成的知識性內容存在嚴重錯誤。
現在,無論是 OpenAI 強勢推出的 ChatGPT,還是最新出爐的 youChat,都不滿足知識準確無誤這一基本要求。從這個意義上講,大規模語言模型和搜索引擎還相距甚遠。
或許 youChat 和 ChatGPT 有幾分相似,但它們在回答正確性方面還有很大的提升空間。