桌面版ChatGPT登臺演講,能視頻通話還會實時讀屏,GPT-4o demo再次驚艷:“能力還是被低估了”
GPT-4o桌面端最新Demo,與Sora的新作品一同亮相“歐洲AI春晚”VivaTech。
現場,OpenAI工作人員不僅展示了觀眾期待已久的“視頻通話”,還試著讓ChatGPT發表了演講。
在視頻聊天當中,即使給它的只有一幅抽象的簡筆畫,它也能立馬get到這是巴黎地標。
然后再給它看一眼地鐵圖,指一指當前位置,就能火速設計出乘車路線。
而且,除了能像移動端一樣通過攝像頭感知環境之外,桌面端的ChatGPT還能夠對屏幕內容進行讀取,結合代碼現場debug。
一系列震撼的演示效果,讓前線的Tom’s Guide編輯Ryan Morrison感嘆,GPT的語音功能和GPT-4o的潛力,看來是被低估了。
桌面端“視頻通話”震撼全場
在現場給400多名觀眾演示ChatGPT最新功能的,是OpenAI開發者體驗主管Romain Huet。
本來Huet打算用手機來演示,結果受到現場技術條件限制無法展示,于是改用Mac,但也正是如此觀眾們才有機會看到它的屏幕讀取能力。
一開始,Huet問ChatGPT能不能給現場的觀眾講一點什么,然后ChatGPT真就像模像樣地打起了招呼。
不過Huet覺得這樣的開場白還不夠有氣勢,于是提示它面前是一大群人,它馬上就心領神會,改用了更“燃”的措辭和語氣。
當然,Huet沒有讓ChatGPT一直講下去,而是在做完開場白之后改由自己來介紹其最新功能。
所有對話,即使跨越語言也能快速響應,現場Huet就要求ChatGPT把自己說的英文翻譯成法語,整個過程行云流水。
另外,看上去是bug,但也許是feature的一點是,翻譯出的法語還帶著一些美國口音,不過Huet表示之后會進行優化,讓ChatGPT說外(非英)語時更像當地人。
又是一通補充講解之后,人們期待的“視頻通話”功能終于正式登場了。
只見Huet現場用筆畫出了埃菲爾鐵塔和凱旋門的草圖,結果ChatGPT只看了一眼就直接識破。
Huet自己也打趣地對它說,”非常感謝你,我畫的這么爛你都能看懂。”
這還沒完,Huet緊接著又掏出了一張巴黎地鐵圖,用手指了指當前的大概位置。
然后,ChatGPT立刻就給出了前往埃菲爾鐵塔的乘車路線,隨著Huet的一句Thank You,現場爆發了潮水般的掌聲。
當然,最新的ChatGPT不僅能拿來讀取攝像頭畫面,也能實時讀取屏幕和剪貼板當中的內容。
作為OpenAI負責開發者體驗的主管,Huet和ChatGPT一起現場搞起了代碼。
Huet通過復制到剪貼板的方式,讓客戶端讀取了一段React框架編寫的網頁代碼,結果ChatGPT立馬就把代碼的語言、功能介紹得頭頭是道。
甚至還當眾進行了Debug,通過讓ChatGPT讀取屏幕,Huet告訴它目前這個網頁存在不能根據屏幕寬度進行適配的問題。
通過幾輪對話,Huet成功借助ChatGPT的幫助,完美解決了這個問題,再次收獲了觀眾的掌聲。
One More Thing
在現場,Huet還播放了一段用Sora為大會創作的新視頻,由于現場生成時間較長,觀眾看到的視頻預先制作好的,這也是活動中唯一一個提前做好的效果。
一同展示的還有聲音克隆引擎Voice Engine,Huet錄制了一段20秒的聲音樣本,并用VE進行了完美復刻,而且只需一個按鈕,就能從英語切換到法語、日語等其他語言,并在Sora中應用。
不過由于安全問題仍未解決,Sora和Voice Engine依舊不能公開發布,想體驗的朋友要再等一等了。
另外,說到克隆聲音的問題,寡姐和OpenAI關于Sky的爭議剛好也有了新消息。
華盛頓郵報稱,根據其所獲得的文件和錄音顯示,給Sky配音的女演員的確另有其人。
而且,寡姐所稱的受到奧特曼邀請發生在去年9月,而配音演員的招募在5月就已開始。
不過,仍然有網友認為,就算真的是另找了一名演員,也不能說明OpenAI就沒有模仿寡姐的意圖。
但無論OpenAI的意圖如何,真正給Sky配音的演員卻是無辜的,也有表演的權利。
不少網友發聲對她表示同情:
Sky的配音演員同樣有權利使用她自己的聲音,難道因為(寡姐)是名人,所擁有的知識產權就比普通人更多嗎?
進一步地,我認為雖然“OpenAI侵犯了寡姐的‘公開權’”這個觀點比單純的侵犯知識產權的想法好些,但仍然站不住腳。
總之,寡姐拋向OpenAI的子彈仍未落地,我們不妨一邊吃瓜,一邊等待著GPT-4o視頻對話的正式更新。