今年的谷歌I/O大會超「硬」,還展示了下一代AI模型
2022 年的谷歌 I/O 大會,觀眾席終于又坐滿了人,雖然其中大多數是谷歌自己的員工。
「去年我們分享了計算機科學的最新發展,而我們的目標一直是讓全世界的信息變得讓全人類都能訪問,」谷歌 CEO 桑達爾 · 皮查伊(Sundar Pichai)開場說道。
今天的大會上,谷歌展示的也大多是人們都可以用到的,即將實裝且免費的應用。
如今機器學習工具已經讓這一愿景很大程度上成為現實。谷歌翻譯中實用化的機器學習模型已經可以不需要雙語對應的語料庫即可自行學習新語言。
翻譯系統是人工智能最經典的任務之一,谷歌的機器翻譯在多年發展過程中一直保持領先,還催生出了像 transformer 預訓練模型這樣的重要 AI 技術。在 I/O 大會上,谷歌宣布自家的翻譯系統新增了 24 種新的語言,其中包括一些小眾的美洲原住民語言,覆蓋共計 3 億人。
在計算機視覺領域,谷歌地圖則通過 3D 重建技術實現了完全自由的沉浸式視圖,天空的樣子是實時天氣,甚至還可以讓你「走進」一家餐館:
就像是在手機上玩一個模擬真實環境的游戲。
在視頻網站 YouTube 中,現在經過 DeepMind 訓練的 AI 已自動為 8000 萬個視頻分出章節,讓觀看者可以自動跳轉到最感興趣的部分,還帶有 16 種自動翻譯字幕。
最先進的預訓練大模型現在進入了日常工作中。「當你有一個 25 頁的文檔還沒看,卻馬上要和別人開始討論了,這時候該怎么辦?」皮查伊說道。
谷歌文檔現在有了自動總結功能,可以把幾十頁文件總結成幾句話,這是自然語言處理(NLP)領域的重大飛躍,效果超過過去最好的機器學習的能力。除了文檔,谷歌的 AI 還能為聊天內容提供摘要,自動轉錄和總結功能也引入了 Google Meet,以后也不需要寫會議記錄了。
谷歌副總裁 Prabhakar Raghavan 向我們介紹了谷歌最核心業務搜索的改進:未來的搜索應該是隨時隨地,使用任何輸入方式實現的。
谷歌搜索不再滿足于輸入關鍵詞,而是通過更自然和有邏輯性的語言,以及語音和視頻來完成。
上個月,谷歌推出了 Multisearch,它可以讓你通過拍照和提問的方式在谷歌應用中進行搜索。這是一個強大的想法,能夠讓你搜索無法描述的東西,比如拿手機一拍,「我要買這個,在哪里可以買到這個?」。
或者「如何才能讓我種的花看起來和這個一樣?
Prabhakar Raghavan 表示,未來 Multisearch 還將提升本地搜索功能,并在今年晚些時候覆蓋更多國家,推出多語言版本。
這并不只是簡單的拍照加描述文字搜索,APP 會通過算法拼接視頻中的場景,然后通過知識圖譜分析得出圖像中的內容,谷歌可以給出準確的物體識別,并提供有用的建議。如果你拿手機攝像頭掃一個貨架,它能顯示每種巧克力的用戶評分。
這種被稱為 Scene Exploration 的能力或許是 AR 領域里迄今為止最好的 demo,就好像為現實世界裝上了一個 Ctrl+F 快捷鍵。
在提升算法公平性方面,谷歌與哈佛大學 Monk 教授合作開發了膚色量表(Monk Skin Tone Scale),能更準確地在搜索結果中反映人們的膚色。
在谷歌的帶屏幕智能音箱 Nest Hub 上,現在不用每次都說 hey Google 了。新的注視功能,就像人們互相交流時眼神接觸一樣,你看著音箱說話就可以免喚醒詞。
Quick Phrases 功能則更加直接:只要說關燈、拉窗簾等祈使句就能指揮谷歌助手完成任務。
為了讓人和語音助手之間的交流更順暢,更多的機器學習模型現在在本地運行,大幅度降低了響應延遲。
一切都在朝著人性化的方向發展。
下一代 AI 模型
在應用之下,谷歌一直在探索人工智能的最前沿。谷歌的對話 AI 模型 LaMDA 今年升級到了第二代,新模型顯著提升了對話質量,在 AI test kitchen 中,你可以通過不斷選擇話題,讓模型自動生成一個故事。
它也可以用來為你提供建議,現場展示了一個「如何開墾一個小花園」的話題,AI 可以不斷提出建議,你也可以選擇自己想要了解的方向無限深入下去。
「它展示了語言模型未來的潛力,在你搬到了一個新城市之后,它可以幫你解決很多問題,」皮查伊表示。
去年,Jeff Dean 所帶領的團隊提出了「下一代通用 AI 架構」Pathways,旨在用一個架構同時處理多項任務,并且使其擁有快速學習新任務、更好地理解世界的能力。
在今年 4 月提交的論文《PaLM: Scaling Language Modeling with Pathways》中,谷歌研究人員用 Pathways 系統訓練了一個 5400 億參數的大型語言模型——PaLM(Pathways Language Model)。
這是一個只有解碼器的密集 Transformer 模型。可以完成的任務包括自動生成代碼、解決數學問題、修復 bug,解釋笑話的梗等等。
皮查伊表示,該語言模型的優點在于可以區分因果關系,理解上下文中的概念組合。通過這種方法,模型在數學問題上的準確率提升到了 58%,接近 60% 的 9 到 12 歲兒童解決問題的水平。
PaLM 現在可以用孟加拉語提問和正確地回答問題,而該模型并沒有經過對應語料庫的訓練,也沒有經過新語言的問答訓練,甚至根本沒有被專門設計用于翻譯。
Jeff Dean 口中的理想通用 AI 模型,難道已經成為了現實?
全新安卓 13 系統:定制化你的使用體驗
每年的 I/O 大會都是安卓新版系統展示的舞臺,今年的重點在于覆蓋所有終端,谷歌也把所有硬件都造了出來。
多年來,安卓已經成為世界上最流行的操作系統。僅去年,消費者就激活十億部新的安卓手機。隨著機器學習的進步,手機可以幫助我們完成超乎以往想象的工作。雖然手機仍是最受歡迎的計算形式,但人們越來越多地將各種連接技術添加到生活當中,比如汽車、電視、和手表等。人們希望這些設備之間兼容、省事且不麻煩。
在谷歌 I/O 大會上,安卓 13 系統終于問世,它具有以下三個新特性:
- 讓你成就更多,把手機置于中心;
- 從手機延伸到各種形式的計算設備,比如手表、平板電腦等;
- 讓各種設備更好地一起工作。
先來看手機設備。安卓 13 通過更多方式適應用戶的風格,所有的應用圖標都可以融入自己的顏色主題。安卓 13 還有一個新的媒體空間,用戶可以根據正在聽的音樂定制外觀。此外,用戶還可以為每個應用設置不同的語言,個性化使用體驗。
安卓 13 還加入了很多安全與隱私功能。當你給他人發信息時,也需要確保他人的隱私和安全。為此,安卓 13 將短信升級到了一種名為「RCS」的新標準,使得端到端加密等重要隱私保護成為可能。這是移動生態系統向前邁出的一大步。目前,谷歌的消息應用已經擁有了 5 億 RCS 月活用戶。谷歌希望每個移動設備都可以升級這種 RCS 標準。
手機和錢包是人們日常生活中必帶的,那么問題來了:手機能取代錢包嗎?谷歌推出了新一代 Google Wallet,這款安卓數字錢包讓你快速安全地獲取日常所需。Google Wallet 將安全地存儲你的信用卡信息,只要是在接受 Google Play 的地方,就可以輕點支付。
Google Wallet 的功能遠不止支付,你還可以用它出示學生證、航班登記,發動汽車,把它當作迪士尼樂園門票。同時,谷歌還將在今年晚些時候將數字身份證帶入 Wallet。先從駕照開始,你可以分享自己的身份信息,而不必將手機交給其他人,只要通過 NFC 點擊或者掃描二維碼即可。
未來幾周,Google Wallet 將在全球范圍內面向安卓和 WearOS 設備推出。
此外,今年晚些時候,安卓 13 還將緊急 SOS 帶入 WearOS 設備,這樣你就可以立即聯系信任的家人和朋友或者直接用手表撥打救援電話。安卓 13 的地震預警系統也將擴展到世界上的高危地區,實現提前預警。
除了手機之外,谷歌還致力于在平板電腦、手表等個人設備上提供安卓的美妙體驗。WearOS 設備比去年增加了兩倍,大屏設備擁有 2.7 億活躍用戶。值得注意的是,安卓目前是唯一可以將類似平板電腦的體驗放入口袋的系統,可折疊設備提供了大屏設備所有的優點,并具備手機的便攜性。
下一步要做的是使多設備實現兼容協同工作。為此,谷歌開發了 Fast Pair 技術,使用戶不用管理任何設置,讓手機、平板和電視輕松配對,實現與耳麥和智能設備的即時互聯。
不過,如果想要將如此方便的互聯功能普及到家里的所有設備,就要用到「matter」了。這是一項將在今年秋季發布的開放行業標準,它連接了谷歌硬件以及數百種受支持的產品,比如燈泡、門鎖和智能插頭。這些支持 matter 的設備只需要幾秒鐘就能進入你的家居、網絡和 Google Home,通過 Fast Pair 對接你喜歡的應用。
谷歌新手機:Pixel 6a 和 Pixel 7/7 Pro
2021 年 10 月,谷歌推出了全新的 Pixel 6 和 6 Pro 手機,其中首次采用了自研的 Tensor 芯片。Tensor 芯片的命名方式讓人想起了谷歌提出的深度學習框架 TensorFlow,以及谷歌服務器芯片 TPU,它的設計宗旨是把谷歌最領先的 AI 技術直接帶入手機端。
在 I/O 大會上,谷歌發布了全新的平價款手機 Pixel 6a,僅售 449 美元。谷歌表示,「這是有史以來該價位最好的智能手機。」Pixel 6a 提供有三種顏色,包括炭黑、粉白和灰綠。7 月 21 日開啟預購,7 月 28 日到店購買。
Pixel 6a 的外觀風格與 Pixel 6 系列一脈相承,具有獨特的雙色外觀,纖細的邊框,6.1 英寸 AMOLED 1080p 顯示屏,提供了 IP67 規格的防塵放水,60Hz 的刷新率。相機方面,Pixel 6a 容納了雙后置相機系統,包括 1200 萬像素的主鏡頭和超廣角鏡頭。前置自拍攝像頭則為 800 萬像素。
更重要的是,Pixel 6a 搭載了與 Pixel 6/6 Pro 相同的 Tensor 處理器和 Titan M2 安全芯片,支持 5G 連接。Pixel 6a 以較低的價格提供更好的性能和更豐富 AI 賦能的體驗,使用戶享受與 Pixel 6/6 Pro 同樣出色的安卓體驗以及獨有的攝影、語音和安全等功能。
除了 Pixel 6a 之外,谷歌還透露了今年秋天要發布的 Pixel 7 和 7 Pro 系列產品,搭載谷歌下一代自研 Tensor 芯片,在語音、攝影、視頻和安全方面帶來更多 AI 驅動的突破和極其個性化的體驗。當然,Pixel 7/7 Pro 將預裝安卓 13 系統,享受最新移動操作系統所帶來的諸多好處。
其中,Pixel 7 Pro 將鋁制材料擴展到整個攝像頭上,這是 Pixel 設計語言的進一步進化。它的三重攝像頭系統為攝影、性能和設計樹立了全新的標準。
好的手機當然少不了好的耳機,I/O 大會上發布了全新的無線耳機 Pixel Buds Pro。
Buds Pro 不僅嵌入了谷歌設計的最佳移動音頻硬件,還是第一款具備主動降噪功能的耳機。谷歌表示,它是當今耳機中噪音消除效果最好的產品之一,這得益于它圍繞新的定制音頻處理器設計。
每個人的耳朵都是獨一無二的,所以耳尖并不總是形成一個完美的密封,有可能導致聲音從外面漏進來。為了解決這一問題,谷歌的主動降噪使用了新的靜音密封技術來補償音頻泄露,有助于最大程度地消除噪音,得到身臨其境的優質聲音,不會分心。
不過有時,你確實想要聽聽周圍發生了什么,這時透明模式將發揮作用。它可以讓外界的聲音進入,讓你體驗周圍世界,就好像根本沒有佩戴耳機一樣。
定制的音頻芯片是為了提高功率效率,為此 Pixel Buds Pro 的續航時間可達 11 小時,降噪模式下為 7 小時。這款耳機還提供了有用的免提體驗,可以向助理詢問各種事情,比如獲得 40 多種語言的實時翻譯。同時支持多點連接,在兼容的手機、平板電腦、筆記本電腦和電視之間切換使用。今年晚些時候還將更新以支持空間音頻,在兼容 Pixel 手機上觀看電影或電視時會體驗到身臨其境的感覺。
新的 Pixel Buds Pro 提供有四種顏色,售價為 199 美元,7 月 21 日預購,7 月 28 日上市。
下面是一直在傳聞中的 Google Pixel Watch,它在今年秋天將隨著 Pixel 7 手機一同發售。
作為第一款完全由谷歌設計的智能手表,它有著最出色的 WearOS 體驗,帶有語言助手、NFC 等功能,可以獨立實現導航等功能,最重要的是不像很多同級產品一樣有過大的表盤。
手機、手表、無線藍牙耳機都齊全了,最后還差一塊大屏,谷歌宣布,2023 年還要推出 Pixel Tablet 平板電腦。
在這些設備發布后,谷歌將會和現在的各家手機大廠一樣建立起較為完整的生態。