終于來了,OpenAI測試GPT-4o高級語音模式!
OpenAI宣布開始向小部分ChatGPT Plus用戶,測試GPT-4o的高級語音模式。
本次測試將主要搜集安全、功能方面的反饋,OpenAI會在8月初分享一份全面的GPT-4o評估報告。隨后,還會發布視頻和屏幕共享新功能。
獲取測試權限的用戶會收到OpenAI發送的一份郵件,一位專門寫AI專欄的作者已經拿到了測試資格。
他希望GPT-4o可以像足球解說員那樣,用激情的語氣去解說一場球賽,并在最關鍵的進球時刻表現出熱血澎湃的吶喊。
第一次GPT-4o好像并沒有達到Cristiano的要求。隨后又要求GPT-4o來了一次更激情的,這一下真把AI逼成黃健翔了,有當年德國世界杯解說那味了。
嚴重懷疑,GPT-4o這段學習了當年意大利對陣澳大利亞的那場經典比賽,并且還在解說中加入了背景噪音這一點挺神奇的。
還有人用GPT-4o進行口語練習,并且會對你的發音進行評分。這對于教育來說幫助是非常大,可以讓很多沒錢請私教的家庭也能公平的享受教育福利。
多語言支持是GPT-4o的一大技術特點,有人測試了法語、西班牙語和烏爾都語,聽起來都挺絲滑的。
有網友表示,GPT-4o相當于為每個人配備了一個專業翻譯,以后全球各個國家交流將不會有太大的障礙,這對于旅游是好事,翻譯行業基本要被搶飯碗了。
還有人傷感的說,他的所有朋友都去世了。但通過這個語音模式和自定義GPT就能“復活”他們,再次與他們聊天自己也不會感到孤獨了。看來語音模式用途還挺廣泛的。
雖然開放測試了,但只是一小部分,這讓人很頭疼啊。那其他用戶需要等三天、一周還是一個月呢?
其實OpenAI已經宣布了,經過本輪測試后,預計今年秋天OpenAI會向所有ChatGPT Plus用戶開放GPT-4o的語音模式。但仍然有人已經迫不及待的想使用了。
早在今年5月14日,OpenAI發布了最新可跨視頻、音頻、文本進行實時推理的旗艦模型GPT-4o。
語音推理模式成為GPT-4o主打功能,支持超過40種語言,能提供實時翻譯、唱歌、練習口語、做數學題、講笑話等。當時在全球科技界引起巨大轟動,隨后宣布在幾周內開啟測試。
但一共拖了兩個月才開始測試,OpenAI表示是因為產品還有安全、性能、算力等方面的問題需要調整,所以延緩了發布時間。
由于ChatGPT Plus需要付費并且國內訪問比較麻煩,可以嘗試一下商湯科技在今年WAIC 2024大會上推出的“國產版GPT-4o”—— 日日新5o大模型。
日日新5o不僅在理解文本和圖像方面表現出色,還能夠理解和生成視頻內容,展現出強大的多模態理解與生成能力,能夠進行跨文本、音頻、圖像與視頻的推理,提供更加豐富和準確的回答。
商湯的日日新5o展示
在全球權威測評中,日日新5.5的得分超過了GPT-4o,顯示出其在英文能力、指令跟隨、長文本理解等方面的顯著提升。
此外,5o模型采用了混合端邊云協同專家架構,基于超過10TB tokens的高質量數據訓練,能夠在保持高性能的同時降低推理成本,有興趣的小伙伴可以體驗一下。
本文轉自 AIGC開放社區 ,作者: AIGC開放社區
