谷歌版Her大翻車：試了3次且換手機才成功…網友：我手動只需10秒

作者：量子位 2024-08-14 12:52:51

人工智能新聞

畢竟明顯是對標OpenAI家的GPT-4o，可以說是吸足了科技圈的眼球。

翻車，大翻車。

就在今天凌晨，谷歌版Her——Gemini Live正式發布。

畢竟明顯是對標OpenAI家的GPT-4o，可以說是吸足了科技圈的眼球。

在官網發布的demo中，拍照問答功能的效果是這樣的：

它大致實現的功能，是用手機拍攝演唱會的海報，并讓Gemini查看用戶的日歷，看看行程是否適合參加。

以及還可以基于此進行一系列后續的操作，包括定時間查票價等等。

然而……當來到發布會現場演示環節的時候，畫風卻180°大變樣。

請看VCR：

第一次：失敗了。
第二次：失敗了。
第三次：換手機，成功了。

嗯……小哥表情，肉眼可見的有點慌。

就連知名科技媒體TechCrunch都配上了這樣的emoji：

甚至還有網友開啟了辣評模式：

我10秒鐘就能搜索我的日歷。

當然，這只是今天Made by Google的一個小插曲。

關于Gemini Live的更多內容，我們繼續往下看。

谷歌版Her的全貌

正如我們剛才提到的，Gemini Live和GPT-4o的功能十分相似。

除了“拍照問答”之外，它也可以做到實時對話，甚至在Gemini回復過程中進行打斷。

據了解，目前Gemini Live的功能已經在安卓系統中向Advanced訂閱者開放（僅限英語）。

未來幾周，這個功能會陸續擴展到更多語言并且向iOS開放。

在對話聲音方面，Gemini Live推出了10種新的聲音供選擇，效果是這樣的：

在操作方面，由于Gemini已經完全集成到了系統中，所以只需長按電源按鈕或說“Hey Google”，就可以調用了。

例如在寫郵件的過程中，讓Gemini幫你生成配圖，效果如下：

不過對于這項功能，外媒們的評價卻是褒貶不一。

例如The Verge的一位作者在親測后給出的標題是——

Gemini Live比Google快，但更尷尬。

具體原因是作者在一次為期三天的公路旅行中，汽車的音頻系統突然失效。

使用原先的谷歌助手尋找解決方案花費了至少五分鐘，而Gemini Live僅耗時15秒。

但對話過程中的Gemini Live的持續發言和需要用戶主動打斷的交互方式，卻讓作者感到尷尬。

他認為：

聲音和說話方式過于人性化，以至于在打斷它時感到不自在。
與Gemini Live的互動中投入了更多情感，而不是將其作為解決問題的工具。

無獨有偶，對于Gemini Live在云端運行這個點，華爾街日報也給出了犀利的評價——

對話上的進步，功能上的退步。

具體到技術層面，GPT-4o是一個端到端的系統，但從谷歌發布的內容來看，Gemini Live則并非如此。

而是將STT、VAD、LLM和TTS系統做了集成：

除此之外，谷歌所發布的新Pixel系列手機中，也出現了Gemini Live的身影。

包括Pixel 9 Pro Fold、Pixel 9、Pixel 9 Pro和Pixel 9 Pro XL。

AI功能方面，谷歌的Pixel手機在拍照上增加了一個叫“Add Me”的功能。

可以用增強現實（AR）和AI技術，可以把兩張不同照片中的人物“塞”到一起。

谷歌為什么追不上OpenAI？

雖然谷歌這次發布Gemini Live，算是對OpenAI GPT-4o的一種應戰，但自從大模型時代拉開序幕以來，我們可以看到一個非常明顯的一種趨勢——

谷歌，跟不上OpenAI的腳步。

首先是在最為關鍵的ChatGPT發布的這個節點上，OpenAI成為了開拓者，但谷歌隨后發布的Bard，和這次Gemini Live很相似，后續出現了翻車情況。

而后近一年半多的時間來，似乎所有重磅模型、重磅應用的發布，都是OpenAI在引領。

反觀谷歌這邊，不僅是技術呈現出步步慢的狀態；甚至在輿論上，還出現了被OpenAI用一個人事變動（Ilya離職）消息蓋過谷歌年度最大活動（I/O大會）熱度的情況。

那么谷歌在大模型時代為什么不行了？

對此，前谷歌CEO Eric Schmidt（2001年至2011年任職）在斯坦福最新的演講中表達了他的觀點：

谷歌非常重視工作與生活的平衡，例如允許員工居家辦公。
但創業公司，他們工作真的很拼。

甚至還有網友爆料稱：

我兄弟是谷歌頂級AI程序員，他有3個全職工作，每天只在谷歌這邊花2個小時。

責任編輯：張燕妮來源：量子位

數據訓練

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌版Her大翻車：試了3次且換手機才成功…網友：我手動只需10秒

谷歌版Her的全貌

谷歌為什么追不上OpenAI？