成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大模型廠商密集發力,谷歌也開“卷”了:Gemini聊天機器人換上新模型,還能一鍵核查輸出內容

人工智能 機器人
即日起,Gemini聊天機器人將改由Gemini 1.5 Flash驅動。與之前的版本相比,窗口長度提高到了4倍,響應速度也更快了。

Meta、OpenAI等大模型廠商密集發力之際,谷歌也宣布了一項重磅更新——

即日起,Gemini聊天機器人將改由Gemini 1.5 Flash驅動。

與之前的版本相比,窗口長度提高到了4倍,響應速度也更快了。

圖片

按照谷歌的介紹,新版聊天機器人背后的1.5 Flash模型,主打的就是輕量化和速度提升。

當然模型回復的質量也有提升,上下文窗口也從原先(基于1.0 Pro)的8k提升到了32k。

圖片

此外新版聊天機器人還增加了“事實核查”功能,可以一鍵檢測生成的內容是否屬實,減輕模型幻覺帶來的不良影響。

有網友感嘆,谷歌今天表現真的很強,先是兩款Aplha系模型(拿下了IMO銀牌),接著Gemini也發布了更新。

圖片

還有人開啟了許愿模式,期待Google Scholar學術搜索當中也能加入AI功能。

圖片

更長上下文窗口,速度也變快了

本次更新的最主要內容,就是把免費版背后的模型從1.0Pro換成了1.5 Flash。

Gemini 1.5 Flash最早亮相于5月的谷歌I/O開發者大會。

通過訓練數據的“蒸餾”,Gemini 1.5 Flash用更輕量化的體積實現了較高的生成質量。

而且小體積也讓模型的速度更快、效率更高,同時它還支持多模態推理。

圖片

谷歌介紹,此次更換模型之后,聊天機器人的速度會變得更快,同時舊版8k的上下文窗口,擴增到了32k。

不過1.5 Flash自身是支持1百萬的上下文的,這樣的削減幅度屬實是不小,但畢竟是免費免費版本。

除了模型的升級,另外一項重要更新就是事實核查功能了。

在最新的Gemini聊天機器人當中,可以通過該功能一鍵對輸出的內容進行檢查。

系統會針對輸出中的內容在谷歌上進行搜索和比對,然后標記出相符和不符之處

圖片

有網友評論說,看到OpenAI上線GPT-4o mini時就覺得谷歌上新只是個時間問題。

的確,不僅是OpenAI和谷歌,Meta、Mistral等在做大模型的廠商最近都是動作頻繁。

而關于模型的表現,這位網友也表示自己試過1.0 Pro和1.5 Flash,兩者表現幾乎相同,而1.5 Flash速度更快。

所以,谷歌的這波操作,一定程度上也是適應了最近興起的“模型輕量化”趨勢。

圖片

那么,更換了1.5 Flash之后的Gemini聊天機器人,表現到底怎樣呢?

一鍵檢查模型輸出

量子位對新版的聊天機器人進行了簡單測試。

首先來看一下這次更新的事實核查功能,第一步是像正常對話一樣隨便提一個問題,Gemini也會正常作答。

圖片

可以看到在答案的下方有一個谷歌的logo,這就是事實核查功能的按鈕了。

點擊之后系統會自動在谷歌進行搜索,然后與自己的輸出內容進行比對。

圖片

比對完成后,能夠搜索到信源且相符的內容會被高亮為綠色,如果與搜索結果存在出入,則會以淺紅底色標注。

圖片

點擊標注的位置,可以看到Gemini用于對比的內容鏈接。

需要注意的是,這樣的標注并不意味著輸出的內容是錯誤的,比如這里引用的對比資料中,湯姆克魯斯的母親是Marry Lee South。

由于文本不匹配,導致答案中這一部分被系統標注,但實際上兩個都是正確答案。

圖片

由于這個事實核查依靠的是互聯網搜索,對比資料的質量也是參差不齊,不一定能做到100%的準確。

比如關于“林黛玉倒拔垂楊柳”這個經典段子,Gemini明明給出了正確答案,結果卻被標紅了。

圖片

再一看引用的對比信息,屬實是有些難繃了。

圖片

所以這個功能的作用,主要是提供了一個更便捷的核查途徑,但具體應當如何采信,還是要依靠多方查證,以及用戶自己的判斷

另外,關于模型本身,我們也測試了幾個最近流行的讓大模型屢屢碰壁的難題。

比如數字比大小,Gemini甚至把兩個數字換算成了錢,但一通操作之后最后的結果是……錯的。

自從這個問題被發現以來,如果這個是第二搞笑的答案的話,應該沒有哪個模型敢稱第一了。

圖片

還有一開始給了個錯誤答案,后面分析過程中糾正過來的。

圖片

但如果用英語提問,還是有希望直接答對的。

圖片

還有數字母的問題,這個回答竟然能從中文里數出字母來……也是把人給整不會了,完全不在預判之內。

圖片

最后,關于此次更新中提到的速度提升,經測試發現,Gemini 1.5 Flash輸出第一個字的耗時要短于Claude 3 Haiku,后續的速度用肉眼觀察區別不是很明顯。

圖片

以上就是Gemini 1.5 Flash在聊天機器人中的表現,感興趣的讀者可以自行嘗試。

參考鏈接:
[1]https://blog.google/products/gemini/google-gemini-new-features-july-2024/
[2]https://x.com/GeminiApp/status/1816512086232731696

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-11-01 07:30:00

2023-05-11 09:57:27

谷歌OpenAI開發聊天機器人

2023-02-15 14:33:26

2023-05-16 12:49:02

谷歌聊天機器人AI

2023-10-29 21:20:04

谷歌Bard聊天機器人

2022-07-05 06:42:01

聊天機器人人工智能

2023-02-23 07:02:16

人工智能聊天機器人

2019-07-03 10:02:47

聊天機器人平臺機器人

2023-05-18 13:38:41

AI代碼機器人

2023-10-12 09:52:13

Bard聊天機器人

2021-05-17 15:05:30

機器人人工智能技術

2023-02-13 11:42:39

2023-06-14 08:09:19

聊天機器人谷歌

2023-05-11 07:45:48

PaLM 2人工智能Bard

2025-02-27 02:00:00

2019-12-19 16:08:40

人工智能機器人數據

2020-02-02 09:19:14

聊天機器人機器人智能

2022-07-03 10:23:06

機器人場景個性化

2021-11-30 10:56:43

ChatterBot機器人人工智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品无码久久久久久国产 | 欧美国产日韩在线观看 | 日日操视频 | 男女视频91| 最新免费视频 | 亚洲欧洲综合av | 亚洲一区二区 | 日韩一级黄色片 | 黄色亚洲| www.99热.com | 日韩在线视频精品 | 在线观看中文字幕视频 | 亚洲国产精久久久久久久 | 黄片毛片免费观看 | 午夜日韩视频 | 久久久久久久久久久久一区二区 | 欧美极品视频在线观看 | 欧美精品国产精品 | 中文字幕亚洲一区二区va在线 | 综合精品久久久 | 夜夜夜夜夜夜曰天天天 | 麻豆精品国产免费 | 日韩在线播放视频 | 综合网在线 | 国产一级片在线观看视频 | 这里只有精品999 | 不卡一区二区在线观看 | 久久一区二| 国产一区二区三区四区五区加勒比 | 国产日韩欧美二区 | 国产 欧美 日韩 一区 | 最新中文字幕在线 | 在线视频a | 久久成人精品视频 | 免费观看一级特黄欧美大片 | 中文字幕一区二区三区四区 | 国产精品一区在线观看 | 国产免费又黄又爽又刺激蜜月al | 天天久久 | 在线一区| 网址黄 |