谷歌發布Gemini Live:對標GPT-4o,讓每一個人都有賈維斯 精華
谷歌在今天凌晨舉辦的“Made by Google 2024”大會上,正式發布了智能語音助手Gemini Live。
Gemini Live的功能與OpenAI在5月推出的GPT-4o語音模式類似,支持自然語言提問,能識別圖像、視頻和語音是一個多模態智能助手。
例如,打開Gemini Live拍攝一幅清明上河圖,然后讓其講解這幅畫的歷史來歷。在講解的過程中,可以任意打斷其對話就像朋友聊天一樣。
也可以授權Gemini Live訪問你的郵箱、地圖和通訊錄,只需要向它說”今晚8點,幫我約阿樂去有福氣酒樓吃飯。”就能幫你自動完成,基本上和鋼鐵俠的AI助理賈維斯差不多。
雖然OpenAI的GPT-4o語音模式展示的很早,但屬于起大早趕了一個晚集至今3個月的時間還在小范圍測試,而谷歌直接快刀斬亂麻領先OpenAI發布語音助手,搶占了安卓手機的市場。
所以,不少用戶表示這一次谷歌確實領先了OpenAI一步。當產品性能差不多的情況下,誰能領先發布,誰就能搶占先機。
從大語言模型再到語音助手,看來谷歌的Gemini是要和OpenAI的ChatGPT死磕到底了。
也有人認為,Gemini Live的出現,可能會讓很多人放棄使用蘋果。其實這個不用著急,谷歌已經明確表示了會在iOS系統中發布只是時間問題。
在Gemini Live演示的現場出現了一個小插曲,主持人拍了一個日歷,然后向Gemini Live提問“請查看我的日歷,看看她今年來舊金山的時,我是否有空?”尷尬的一面出現了,Gemini Live沒有任何反應。
連續問了三次,在第三次主持人已經汗流浹背的時候,Gemini Live才開始回答,“我發現她將于2024年11月9日來舊金山。我查看了你的日歷,那段時間你沒有任何活動。”
現場瞬間爆發出驚喜的尖叫聲~
臺下的尖叫聲確實讓人繃不住,屬于演藝圈老傳統了。
前兩次的提問絲毫沒有反應,那一刻對于主持人來說,世界仿佛都靜止了。
那個尖叫聲讓我咳嗽的厲害,俺甚至都無法呼吸了~
不過也有人表示,相比于提前錄制好的演示demo,即便是失敗兩次也喜歡這種直接演示的,他的勇氣、真誠和敢于冒險精神那是相當值得稱贊的。
Gemini Live的使用方法非常簡單,長按電源按鈕或對著手機直接說“Hey Google”就能開始使用。
Gemini Live除了能理解語音、圖片、視頻之外,還能生成圖片,例如,幫我生成一張用于生日慶祝的圖片,并且可以直接放在谷歌生態應用中使用。
谷歌表示,Gemini Live已經與其郵件、云盤、相冊、天氣等原生應用進行了集成,未來會擴展至Keep、Tasks、Utilities等知名應用,可以幫助人們自動完成更多的日常任務。
目前,安卓手機Gemini Advanced英文版訂閱用戶已經可以使用Gemini Live,提供了10種語音選擇和45種語言,未來幾周谷歌將擴展至iOS系統和更多語言。
本文轉自 AIGC開放社區 ,作者:AIGC開放社區
