萬變不離AI!直擊 Google Cloud Next 2024 大會更多細節,不只Gemini 1.5 Pro !
AI顯然成了谷歌Cloud Next 2024的一條主線!
這一在拉斯維加斯舉行的技術大會,自周二起持續至周四,谷歌宣布了大量新的以云為中心的產品和服務,涵蓋從Gemin、平臺、Workspace到網絡安全工具等一切內容。
Google Cloud Next 是谷歌云面向開發者、合作伙伴與客戶的年度技術大會,自2017年已持續了八年。AI作為今年的絕對主角自然不容小覷,Google Cloud Next 2024緊緊圍繞人工智能技術的進步,探討將如何提高谷歌云服務的生產力、創造力、和安全性等性能。
在AI“卷得飛起”的大背景下,谷歌在云計算領域作出一系列值得一看的創新與合作承諾。現在,谷歌正像對手們做的那樣——快馬加鞭地推出人工智能產品,以免落后于AI大潮。面對“老對手”微軟在這一輪AI競賽的猛烈攻勢,谷歌必須亮劍,見招拆招。
圖片
一.Gemini 1.5 Pro全球最長上下文處理模型
Gemini 1.5 Pro,谷歌最強大的生成式AI模型,現已在其面向企業的AI開發平臺Vertex AI上公開預覽。
該版本專為開發人員實驗而設計,與前一版本相比,提供了一個更大的上下文窗口。Gemini 1.5 Pro 是一個中等規模的多模態模型,其性能與 Gemini 1.0 Ultra 相近,它有一個標準的 128,000 個 “tokens”上下文窗口,還可將該窗口大幅增加至 100 萬個 “tokens”。
一百萬“tokens”有多長呢?相當于大約70萬個單詞(《戰爭與和平》不過60萬字)或大約30,000行代碼。這大約是Anthropic的旗艦模型Claude 3能夠接受的輸入數據量的四倍,也大約是OpenAI的GPT-4 Turbo最大上下文的八倍。對比國內大模型,此長度也遠遠超過了因開“卷”長文本功能一炮而紅的Kimi。
圖片
Kimi對自己處理單詞量的估計
那么,一個擁有100萬“tokens”上下文窗口的模型具體能做什么呢?谷歌承諾,可以進行很多事情,例如分析代碼庫、閱覽長篇文檔并與聊天機器人進行長時間對話。
由于Gemini 1.5 Pro是多模態的,因為它能夠理解圖像和視頻,在Google Cloud Next 2024大會上還宣布了理解音頻流的功能——該模型還可以分析和比較不同媒體中(如電視節目、電影、廣播、電話會議記錄等)的內容。100萬“tokens”大約相當于一小時的視頻或大約11小時的音頻,這是相當驚人的文件處理能力。
得益于其音頻處理能力,Gemini 1.5 Pro還可以為視頻片段生成音頻轉錄,不過轉錄的質量尚未得到確認。
今年早些時候的一個預先錄制的演示中,谷歌展示了Gemini 1.5 Pro在阿波羅11號登月直播的文字記錄(大約400頁)中搜索包含笑話的引語,然后在電影鏡頭中找到與鉛筆素描相似的場景。
X上的網友試圖讓Gemini 1.5 Pro判斷Sora的一支關于貓的視頻是否由AI生成。Gemini 1.5 Pro給出了肯定回答,并解釋說盡管貓的光影比較真實,但貓眼睛大的不夠“自然”且皮毛也過于完美,因此可以考慮是AI生成的視頻。
圖片
不過,Gemini 1.5 Pro處理一百萬標記并不是一蹴而就的。在上述演示中,每次搜索都需要20秒到一分鐘的時間來完成——遠長于平均的ChatGPT查詢。谷歌已經在著手優化回答問題的長延遲問題。
目前,Gemini 1.5 Pro的功能可以在Vertex AI平臺上免費體驗(雖然只開放了部分功能)。
值得注意的是,Gemini 1.5 Pro正在逐漸融入谷歌企業產品生態系統的其他部分,在大會的第一日谷歌宣布,該模型(在私人預覽中)將為谷歌的生成式AI編碼輔助工具Code Assist提供新功能。
二、AI工具塑造辦公未來
1.Google Vids
谷歌正在尋找利用AI幫助客戶開發創意內容的方法。Google Vids是一款新的AI驅動的視頻創作工具,是最新添加到Google Workspace的功能。
它的工作原理是這樣的:谷歌聲稱用戶可以使用 Vids與其他Workspace工具(如Docs和Sheets)一起制作視頻。從編輯、寫作和制作的整個視頻制作流程都在Google Vids中完成,并且支持團隊的實時協作。
圖片
2.Gemini Code Assist
谷歌推出的AI編程輔助工具,也是微軟旗下GitHub Copilot 的直接競爭對手。谷歌Gemini Code Assist是一款以企業為中心的AI代碼補全和輔助工具。谷歌此前在已停用的Duet AI中提供了類似的服務,現在該功能已經集合在Gemini里。
3.Google Workspace
Google Workspace中發布的新功能包括在移動時啟動基于AI的“幫助我寫作”功能的語音提示,用于Gmail。Gmail的另一個功能是利用AI對粗糙的電子郵件草稿進行潤色,變成更精致的電子郵件。
谷歌似乎還計劃為其Google Workspace生產力套件的兩個新AI功能上取得盈利,推出了每位用戶每月10美元的附加套餐。其中一個是新的AI會議和消息傳遞附加組件,它可以為用戶記筆記,提供會議摘要并將內容翻譯成69種語言。另一個是引入的AI安全套餐,它幫助管理員使Google Workspace內容更加安全。
圖片
三、為企業用戶提供的更多AI能力
1.備受爭議的Gemini圖像生成終于回來了
今年2月,谷歌宣布了一個內置于Gemini中的圖像生成器。該公司在發現它會隨機地將性別和種族多樣性注入到有關人的提示中,例如生成了黑人版的馬斯克肖像,隨著大量批評的涌入谷歌撤回了這一功能。
現在,谷歌推出了增強的圖像生成工具,Imagen 2。在Vertex AI開發者平臺內部,Imagen 2更側重于企業用戶。Imagen 2帶來了一些有趣的新功能,例如“文本到實時圖像”可以從文本提示創建短小的四秒視頻,提供類似于Runway、Pika等文生視頻工具的服務。
2.Agent Builder
谷歌的Vertex AI Agent Builder是一個幫助公司構建AI代理的新工具。
“Vertex AI Agent Builder允許人們非常輕松快捷地構建對話代理,”谷歌云CEO Thomas Kurian說。“您可以構建并部署生產就緒的、生成式AI驅動的對話代理,并像指導人類一樣指導它們,以提高模型答案的質量和正確性。”
為此,公司使用了一個稱為“grounding”的過程,其中答案與被認為是可靠來源的東西聯系在一起。在這種情況下,它依賴于谷歌搜索(實際上可能或可能不準確)。
3.AI讓安全工具更強大
谷歌在安全工具中注入AI能力,推出了許多針對大公司的新產品和服務。這些包括威脅情報,它可以分析大量潛在惡意代碼,它還允許用戶使用自然語言搜索進行中的威脅或妥協指標。另一個是Chronicle,谷歌為云客戶提供的網絡安全 telemetry 服務,以協助進行網絡安全調查。第三個是企業網絡安全和風險管理套件Security Command Center。
參考鏈接:
??https://techcrunch.com/2024/04/09/google-cloud-next-2024-everything-you-need-to-know/??
??https://techcrunch.com/2024/04/09/googles-gemini-pro-1-5-enters-public-preview-on-vertex-ai/??
??http://www.ekrvqnd.cn/aigc/??
本文轉載自??51CTO技術棧??
