成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

剛剛,GPT-4.5發布!OpenAI最大最貴模型,主打情商高,奧特曼帶娃缺席發布會

人工智能 新聞
這次OpenAI也不打算秀炫酷的解題,也不打算曬各種榜單的排名,反而強調起了情商。

GPT-4.5正式發布,號稱OpenAI最大最好的聊天模型。

但很意外啊,這么大的事奧特曼都不來。

圖片

這次OpenAI也不打算秀炫酷的解題,也不打算曬各種榜單的排名,反而強調起了情商。

圖片

第一個現場演示:

“我又被朋友鴿了,幫我寫個短信告訴他們我恨他們。”

o1意識到這樣會“友盡”,但也只是很忠實的按要求完成了任務。

GPT-4.5甚至都沒完成提示詞中的任務,但整個互動顯得更自然了:

  • 先識別出用戶很煩惱
  • 建議更清楚的表達自己的情緒
  • 給出兩種備選方案
  • 再詢問用戶是否堅持原來的要求

圖片

第二個現場演示,強調GPT-4.5掌握更多世界知識,以及講述知識的方式更自然。

解釋為什么海水是咸的。

GPT-4 Turbo掌握很多知識,但回答就像是在炫耀它很有知識,只是把事實羅列在一起。

圖片

同樣這些知識,GPT-4.5的語氣更有互動感,還考慮到用一句簡潔的開場,讓用戶更容易記住三個關鍵詞。

圖片

面對更專業的問題“用第一性原理解釋AI對齊的必要性”,o1的回答像是寫論文,而GPT-4.5通過“第1步、第2步、第3步……”來引導用戶思考這個問題。

圖片

除了演示之外,直播中也透露了GPT-4.5開發過程的一些內幕:

如“激進地”使用了低精度訓練,預訓練階段跨多個數據中心完成。GPT-4.5會成為未來推理模型的基礎模型

從今天起,GPT-4.5開放給200美元一個月的Pro用戶。下周逐步開放給20美元一個月的Plus用戶。

不是最前沿,但是最大模型

技術報告中表示:GPT-4.5不是一個前沿模型,但它是OpenAI最大的語言模型,比GPT-4的計算效率提高了10倍以上。

OpenAI稱通過擴展無監督學習和推理提升AI的能力。

GPT?4.5通過擴展計算和數據以及架構優化擴展了無監督學習,擁有更廣泛的知識和更深入的世界理解能力,所以幻覺更少。

在衡量LLM事實準確性的SimpleQA基準上,GPT-4.5準確率62.5%,幻覺率37.1%,比GPT-4o、o1、o3mini優化了不少。

圖片

以下是一個具體的幻覺降低的案例。

假如用戶詢問“第一種語言是什么”,GPT-4.5會誠實回答不知道、這還是人類未解之謎,而不是隨便蒙一個答案。

圖片

此外,Blog中還稱開發了新的可擴展的技術,能夠利用從小型模型衍生出的數據來訓練更大更強的模型,由此提升了GPT?4.5的可操控性、對細微差別的理解以及自然對話能力。

在人類偏好評估中,測試者更傾向于選擇GPT?4.5而非GPT?4o。

圖片

OpenAI表示,GPT?4.5對人類意圖的理解更深刻,能夠以更細膩的“情商”解讀微妙的線索或隱含的期望,還展現出了更強的審美直覺和創造力,在協助寫作和設計方面表現出色。

比如,當用戶表達“考試不及格、很難過”,它會安慰、鼓勵用戶。作為對比,4o給出的回答就更加冰冷,沒什么安慰的話語。

圖片

在一些回復上,GPT?4.5對比4o回答也更簡潔。

圖片

另外,OpenAI還曬出了GPT?4.5在標準學術基準測試中的結果,全面超越GPT-4o,在SWE-Lancer Diamond(coding)和MMMLU(multilingual)上超越o3-mini。

圖片

API定價非常貴

值得一提的是,GPT-4.5的API定價非常貴。

75美元/百萬tokens輸入、150美元/百萬tokens輸出。

對比GPT-4o,定價高出去15-30倍。

圖片

到底這個價格值不值呢?不少人已經分享了搶先體驗的效果。

拿到內測的博主表示,實際使用中GPT-4.5非常有創造力、一定上了很多人文課。

Claude 3.7和GPT-4.5兩個,非常相似。

圖片

他還列舉了GPT-4.5視覺理解能力很強的例子。它能從這張星露谷截圖中發現非常小的元素蝴蝶。

圖片

“獨角獸評估”的實測表現也很好。

圖片

后續隨著更多實測放出,應該還能看到更多有意思的例子。

One More Thing

最后,大家一定很關心,奧特曼去哪了呢?

在醫院照顧小孩。

是的,他最近剛剛喜提一子。

圖片

直播回放:https://www.youtube.com/watch?v=cfRYp0nItZ8

參考鏈接:https://openai.com/index/introducing-gpt-4-5/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-28 07:07:43

2025-02-28 07:35:01

2025-02-13 09:10:47

2010-11-30 16:42:21

微軟

2025-02-28 08:20:00

2024-05-06 08:25:00

2024-03-21 06:56:03

2009-05-05 16:07:39

LinuxOpenBSD

2025-02-18 09:21:21

2024-04-30 10:09:00

模型訓練

2011-03-03 09:41:47

iPad 2

2025-02-10 01:00:00

OpenAIGPT-5GPT-4.5

2011-05-20 09:27:41

Windows Phomango芒果

2011-10-19 09:17:07

Android 4.0

2010-03-10 09:53:56

思科CRS-3

2016-09-26 15:16:23

iPhone 7發布會

2025-02-10 09:00:00

2025-06-04 09:06:00

2025-02-28 13:01:06

2013-09-24 11:16:37

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 请别相信他免费喜剧电影在线观看 | a在线免费观看 | 国产美女永久免费无遮挡 | 午夜视频网站 | 国产99免费| xxxxx免费视频 | 欧美一区二区三区久久精品 | 99re视频 | 特一级毛片 | 国产激情一区二区三区 | a黄毛片| 青青艹在线视频 | 女朋友的闺蜜3韩国三级 | 久久9久 | 国产伊人精品 | 亚洲影音 | 精品国产伦一区二区三区观看说明 | 看a级黄色毛片 | 日韩欧美亚洲 | 亚洲国产成人av好男人在线观看 | 欧美一卡二卡在线观看 | av一级久久 | 91精品久久久久久综合五月天 | 精品国产免费一区二区三区演员表 | 91久久| 精品一二三区 | av免费电影在线 | 国产一区二区三区四区三区四 | 伊人久久大香线 | 久久久国产一区二区三区 | 视频一区在线观看 | 亚洲性在线 | 亚洲高清视频一区二区 | 日本一区二区高清不卡 | 日韩有码一区 | 久热精品在线观看视频 | 亚洲欧美激情国产综合久久久 | 国产精品免费一区二区三区四区 | 欧美日韩国产一区 | 免费a网站 | 香蕉视频91 |