谷歌打響全面反擊戰(zhàn)!官宣AI重構搜索、新模型比肩GPT-4,朝著ChatGPT微軟開炮
萬眾矚目,谷歌的反擊來了。
現(xiàn)在,谷歌搜索終于要加入AI對話功能了,排隊通道已經開放。
當然這還只是第一步。
大的還在后面:
全新大語言模型PaLM 2正式亮相,谷歌聲稱它在部分任務超越GPT-4。
Bard能力大更新,不用再排隊等候,并支持新語言。
谷歌版AI辦公助手也一并推出,將在Gmail中搶先亮相。
谷歌云也上線多個基礎大模型,為行業(yè)提供更進一步的生成式AI服務……
在最新一屆I/O開發(fā)者大會上,谷歌的大放送真的太震撼。
有網友直呼:
AI大戰(zhàn)全面開啟。
有人甚至表示:
現(xiàn)在我后悔為ChatGPT付費了。
一場發(fā)布會結束,谷歌股價上漲超4%。
PaLM 2部分任務超越GPT-4
毫無疑問,PaLM 2是今年I/O大會的重中之重,由皮查伊親自做介紹。
目前的Bard以及谷歌超過25個AI產品和功能,現(xiàn)在都由PaLM 2作為底層技術支持。
作為谷歌目前最先進的大模型,PaLM 2基于Pathways架構,是PaLM的升級版,通過JAX在TPU v4上構建。
據介紹,PaLM 2接受了100多種語言的訓練,這使得它在語言理解、生成和翻譯上的能力更強,并且會更加擅長常識推理、數學邏輯分析。
谷歌表示,PaLM 2的數據集中有海量論文和網頁,其中包含非常多數學表達式。在這些數據的訓練后,PaLM 2能輕松解決數學問題,甚至是制作圖表。
編程方面,PaLM 2現(xiàn)在支持20種編程語言,如Python、JavaScript等常用語言,以及Prolog、Fortran和Verilog等。
這一次谷歌一并推出了四種不同size的PaLM 2。
他們用不同的動物來體現(xiàn)規(guī)模大小。最小的是“壁虎”,最大的是“獨角獸”。
其中“壁虎”版本是非常輕量級的,能在移動設備上快速運行,包括離線狀態(tài);每秒可處理20個token。
DeepMind副總裁在I/O大會前的新聞發(fā)布會上表示:
我們發(fā)現(xiàn)模型并不總是越大越好,這也是為什么我們決定提供一系列不同規(guī)模的模型。
這意味著微調PaLM 2會更加方便,由此它也能支持更多產品和應用。
在I/O大會上,谷歌就宣布了現(xiàn)在已經有超過25個產品和應用正在使用PaLM 2的能力。
具體的表現(xiàn)形式,就是Duet AI。
可以將它理解為微軟365 Copilot的對標產品,是一個能夠內嵌在各種辦公軟件中的AI助手。
谷歌在發(fā)布會現(xiàn)場已經展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。
包括根據提示補充郵件內容、生成PPT、根據提示生成圖片素材、一鍵生成表格等。
同樣,這個AI助手也能提供編程幫助。基于谷歌云,它能實時推薦、糾錯代碼塊,并且以對話方式解答編程問題,目前支持Go、JavaScript、Python和SQL。
另外基于PaLM 2,谷歌還推出了一些專業(yè)領域大模型。
谷歌的健康團隊打造了Med-PaLM 2。它能回答各種醫(yī)學問題,據稱是首個在美國醫(yī)療執(zhí)照考試中達到專家水平的大語言模型。
目前谷歌正在嘗試讓它具備多模態(tài)能力,比如自己檢查X光片后給出診斷。在今年夏天晚些時候,這個模型將對一小部分谷歌云用戶開放。
另一個專業(yè)大模型是Sec-PaLM 2。
這是一個面向網絡安全維護的大模型,它能分析和解釋潛在的惡意腳本,并檢測腳本的危險性。
那么,在展示了PaLM 2一眾卓越能力后,就該聊聊怎么開放使用了。
谷歌表示,現(xiàn)在可以通過PaLM API接口、Firebase和Colab使用PaLM 2。
Bard全面開放,支持圖片、集成自家地圖等應用
對標ChatGPT的Bard終于取消排隊試用,在全球180+國家和地區(qū)進行全面開放了。
新增黑暗模式,備受程序員好評:(手動狗頭)
除了擴大訪問范圍,Bard也在英文之外,新增直接用日語和韓語對話的功能。中文看起來還得再等下一波——谷歌表示,很快就會新增到40種語言版本。
由于從今天起,Bard將全面接入PaLM 2,所以它在編程和推理上面的能力也有了很大的提升,代碼生成、調試和解釋都更加專業(yè)(獲得程序員認可的那種)。
當你讓它用python寫一段國際象棋中的“四步殺”(scholar’s mate)招式,里面參考了別的代碼,它會給出相關鏈接,方便你查看。
你可以就它給出代碼中某個不懂的函數進行進一步提問,問它能否再改善一下,或者是要求它將所有內容都合并的一個代碼塊中。
不過,最驚喜的當屬應廣大開發(fā)者要求,加入了一鍵導入功能。
現(xiàn)在,你可以將Bard生成的代碼直接導出到Colab。
除了代碼,你用Bard生成的任何內容,比如電子郵件草稿、表格什么的也都可以直接拖到Gmail、Docs和Sheets中。
對了,Bard現(xiàn)在的回答中也支持圖片了。拿來問旅游攻略最方便不過:
除了它能用圖片回答你,你也能直接丟給它圖片,比如上傳一張兩只狗狗的照片,讓它來幫你編點好玩的故事:
這個功能由Google Lens(一款能讓機器學會“看圖說話”的AI應用)提供支持。
除了Google Lens,Docs、Drive、Gmail、地圖等多個谷歌自家的應用能力也整合到了Bard之中。
比如在Bard的回答中直接用谷歌地圖查看幾所大學的地理位置:
有種現(xiàn)在要用谷歌的各種產品,只用Bard一個入口就夠了的感覺。
除了自家應用,Bard這次還把Adobe Firefly給搬了上來,各種有版權的創(chuàng)意圖像用對話就可以“信手拈來”:
搜索重構,加入AI對話
千呼萬呼,谷歌搜索終于開啟了AI對話的能力。
“一家?guī)в幸粋€不到3歲孩子和一只狗的家庭來說,去布萊斯峽谷還是拱門國家公園游玩更好?”
對于這個問題,擱以前,你可能需要自己把它拆成各種小問題去搜索引擎整理大量信息,最終才能找到答案。
現(xiàn)在谷歌讓你盡量一步到位。
如圖所示,谷歌搜索沒有簡單地搬運搜出來的答案,而是將孩子和狗這兩個因素都考慮進去給出整理后的回答,比如它說:
布萊斯峽谷有兩條狗能進入的環(huán)路,對嬰兒車也十分友好;拱門國家公園則大部分路段都不允許寵物進入;兩個地方都要求寵物拴上皮帶等。
每句話都有具體的依據鏈接供查看:
除此之外,它還會顯示了來自不同網站網友發(fā)布的攻略鏈接。
最重要的是,你可以對它的回答進行進一步對話式的提問,點擊“ask for a follow up”按鈕即可。
用新的谷歌搜索進行購物也非常有趣,它號稱可以幫你迅速做出理性的購買決定。
比如當你想要一輛“適合5英里山地通勤的自行車”,它會先告訴你挑選之前需要考慮的重要因素,比如:
一看設計:電動自行車、公路自行車和混合動力自行車等適合通勤;
二看電機和電池,三看減震用的懸架,有山路的通勤需要應對裂紋和顛簸帶來的沖擊等。
然后再給你推薦合適的車,推薦時還會給出具體產品說明、最新評價、價格和圖片等全面信息。
你也可以進行進一步提問,比如只要紅色電動自行車,它會進一步優(yōu)化回答。
這個功能由谷歌的購物比價產品Shopping Graph提供支持,它可以搜集并不斷更新來自全世界的產品列表。
值得一提的是,谷歌直言更新后的AI搜索界面照樣會植入廣告,但放心:它只會在專用廣告位中出現(xiàn),不會混進你的搜索結果中。
最后,這個新功能目前還只能在谷歌Search Labs中申請試用,且僅限美國地區(qū)的用戶體驗。
三大基礎模型上線谷歌云
今年I/O大會,谷歌云的內容也同樣搶眼。
在更新了一大波AI能力后,谷歌為自家云端機器學習平臺Vertex AI,上新了三款大模型:
Codey:text-to-code,幫助程序員寫代碼
Imagen:text-to-image,生成高質量圖像
Chirp:speech-to-text,方便溝通
這三種模型的能力其實在今天的發(fā)布會上都有展示過,比如生成代碼、谷歌照片智能編輯等。
除此之外,在Vertex AI上現(xiàn)在還能使用文本和圖像的嵌入式API。它支持將文本和圖像數據轉換為多維數值向量、映射語義關系,從而允許開發(fā)者創(chuàng)建出更加有意思的應用。
另一個重大更新則在RLHF上,谷歌表示他們是首個將此功能作為托管服務放到端到端機器學習平臺行的。好處是能讓企業(yè)結合RLHF快速訓練獎勵模型,用于微調基礎模型,這對于大模型在行業(yè)應用中的準確性提升非常關鍵。
除了模型方面,谷歌云在訓練上還推出了下一代A3 GPU超算。通過將A3虛擬機和Nvidia H100結合,谷歌云能夠提供更大的計算吞吐量和帶寬,能夠讓企業(yè)更快開發(fā)機器學習模型。
除了這些,谷歌這次還帶來售價1799美元(合人民幣約1萬2)的首款折疊屏手機等新硬件產品,以及接入AI功能的Android 14系統(tǒng)(比如提供信息回復建議什么的),這里就不一一展示了。
總的來看,作為第15屆I/O大會,谷歌這次著實給大家?guī)砹朔浅6嗟母韶洝?/p>
值得一提的是,這次上臺介紹的發(fā)言嘉賓,已不見Jeff Dean的身影,他前幾日剛剛職級變動。
作為從前Google AI最代表性發(fā)言的高管,在AI 2.0浪潮里,將何在?
谷歌是否還能在大模型和AI搜索領域中奮起追上,也值得期待。
你對這次谷歌的反擊,滿意嗎?