成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<abbr id="uicao"></abbr>

<li id="uicao"><source id="uicao"></source></li>

<dl id="uicao"></dl>

<bdo id="uicao"><source id="uicao"></source></bdo>

<button id="uicao"></button>

<li id="uicao"><dl id="uicao"></dl></li>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

o1不是聊天模型？24小時(shí)熱度暴漲，奧特曼、Brockman在線圍觀

2025-01-13 12:30:58

在剛剛過(guò)去的一天，一篇名為《o1 isn’t a chat model（and that’s the point）》的文章引發(fā)了包括 OpenAI CEO Sam Altman、總裁 Greg Brockman 的關(guān)注。

不要再將 o1 當(dāng)做聊天模型了。

如何定位 o1 模型？你是否常常將其當(dāng)做一個(gè)聊天模型來(lái)使用。

在剛剛過(guò)去的一天，一篇名為《o1 isn’t a chat model（and that’s the point）》的文章引發(fā)了包括 OpenAI CEO Sam Altman、總裁 Greg Brockman 的關(guān)注。

這篇文章表示 o1 不是一個(gè)聊天模型，我們可以將它想象成一個(gè)報(bào)告生成器。

原文鏈接：https://www.latent.space/p/o1-skill-issue

2014 年，OpenAI 接連放出了 o1、o1 pro、o3 模型，隨著模型推理能力的提升，隨著而來(lái)的是高昂的訂閱費(fèi)。但很多人在訂閱使用后發(fā)現(xiàn) o1 的表現(xiàn)并不如宣傳的那樣好，當(dāng)然也包括本文的作者——曾任SpaceX軟件工程師、蘋果VisionOS人機(jī)交互設(shè)計(jì)師的Ben Hylak。

Hylak 表示每次他問(wèn) o1 一個(gè)問(wèn)題時(shí)，都要等上 5 分鐘的時(shí)間，結(jié)果看到的只是一大堆自相矛盾的胡言亂語(yǔ)，還有未經(jīng)請(qǐng)求的架構(gòu)圖 + 優(yōu)缺點(diǎn)列表。這讓 Hylak 很是惱火，因此直言 o1 就是垃圾。

o1 回答問(wèn)題，多次自相矛盾。

為了表達(dá)心中的憤怒，Hylak 還在社交媒體上分享了這種觀點(diǎn)，「我今天一整天都在使用 o1 pro—— 我再怎么強(qiáng)調(diào)也不為過(guò) —— 它真的很糟糕。」

「輸出內(nèi)容幾乎接近胡言亂語(yǔ)，在同一個(gè)答案中多次自相矛盾。例如：我向它征求關(guān)于重構(gòu)的建議。它建議合并文件，但輸出的代碼塊中文件并未合并，然后又出現(xiàn)了完全不相關(guān)的結(jié)論?！?/span>

圖源：https://x.com/benhylak/status/1864835651725910023

對(duì)于 Hylak 的觀點(diǎn)，有人表示贊同，但也有人強(qiáng)烈反對(duì)，他們認(rèn)為 o1 表現(xiàn)非常好。

隨著 Hylak 與那些持反對(duì)意見的人交流越來(lái)越多，他逐漸意識(shí)到自己完全錯(cuò)了：他把 o1 當(dāng)作聊天模型來(lái)使用，但實(shí)際上 o1 并不是聊天模型。

對(duì)于作者態(tài)度的轉(zhuǎn)變，奧特曼很是欣慰，表示道：「隨著人們學(xué)會(huì)如何使用 o1（包括 pro 版），觀察人們對(duì)它態(tài)度的轉(zhuǎn)變真是很有趣?！?/span>

奧特曼關(guān)于這條博客的推文瀏覽量達(dá)到 1.5M 。

Greg Brockman 表示：「o1 是一個(gè)不同類型的模型。要獲得出色的性能，需要以一種與標(biāo)準(zhǔn)聊天模型不同的新方式來(lái)使用它?！?/span>

如果 o1 不是聊天模型，那它是什么？

我們可以把它想象成一個(gè)報(bào)告生成器（report generator）。如果你給定足夠的上下文，然后告訴它你想要的輸出，o1 通常會(huì)一下子確定解決方案。

接下來(lái)的問(wèn)題是，如何使用 o1。

不要寫提示，要寫 Brief

給它大量的上下文，上下文的數(shù)量作者用 ton 來(lái)形容，我們可以把它想象成提示的 10 倍。

這張圖解釋了如何構(gòu)建一個(gè)針對(duì) o1 模型的提示（prompt），并將其分為幾個(gè)部分。

通常情況下，當(dāng)你使用像 Claude 3.5 Sonnet 或 4o 這樣的聊天模型時(shí)，會(huì)先提出一個(gè)簡(jiǎn)單的問(wèn)題并附帶一些上下文。如果模型需要更多的上下文，它通常會(huì)向你詢問(wèn)。

你會(huì)與模型來(lái)回迭代，糾正它并擴(kuò)展需求，直到達(dá)到期望的輸出。聊天模型本質(zhì)上是通過(guò)這種來(lái)回交互的方式從你這里獲取上下文。在與模型交互過(guò)程中，我們可能會(huì)變得越來(lái)越懶，只要還能得到好的輸出，輸入的提示越來(lái)越敷衍。

但是，o1 會(huì)直接接受那些敷衍的問(wèn)題，并不會(huì)試圖從我們這里獲取上下文。相反，你需要盡可能多地向 o1 提供上下文。

即使你只是詢問(wèn)一個(gè)簡(jiǎn)單的工程問(wèn)題，你也需要：

詳細(xì)說(shuō)明所有你嘗試過(guò)但沒(méi)有奏效的方法；
添加所有數(shù)據(jù)庫(kù)架構(gòu)的完整 dump；
解釋你公司的業(yè)務(wù)、規(guī)模（并定義公司特有的術(shù)語(yǔ)）。

簡(jiǎn)而言之，我們要把 o1 當(dāng)作一個(gè)新入職的員工來(lái)對(duì)待。

把更多的時(shí)間用在開頭提示上。圖源：https://x.com/swyx/status/1839213190816870425

專注于目標(biāo)：準(zhǔn)確地描述你想要什么

一旦你向模型提供了盡可能多的上下文，就需要專注于解釋你希望輸出是什么。

在大多數(shù)模型中，我們會(huì)告訴模型我們希望它如何回答我們。例如：你是一位專家級(jí)軟件工程師。你需要模型進(jìn)行慢思考且思考的很仔細(xì)。

這與使用 o1 取得成功的方法完全相反。不要告訴它如何做 —— 只告訴它做什么。然后讓 o1 接管，自行規(guī)劃和解決問(wèn)題的步驟。這就是自主推理的作用所在，實(shí)際上這比你作為人工環(huán)節(jié)手動(dòng)審查和聊天要快得多。

知道 o1 擅長(zhǎng)什么、不擅長(zhǎng)什么

o1 擅長(zhǎng)什么：

完美地一次性處理整個(gè) / 多個(gè)文件：到目前為止，這是 o1 最令人印象深刻的能力。例如，復(fù)制 / 粘貼大量代碼，大量關(guān)于正在構(gòu)建內(nèi)容的上下文，o1 會(huì)完全一次性地完成整個(gè)文件（或多個(gè)文件），通常沒(méi)有錯(cuò)誤，遵循現(xiàn)有模式代碼庫(kù)。
減少幻覺(jué)：例如，o1 確實(shí)擅長(zhǎng)定制查詢語(yǔ)言（如 ClickHouse 和 New Relic），而 Claude 經(jīng)?；煜?Postgres 的語(yǔ)法。
醫(yī)療診斷：Hylak 的女朋友是一名皮膚科醫(yī)生，當(dāng)朋友或家人有皮膚問(wèn)題時(shí)，他們通常會(huì)給 Hylak 的女朋友發(fā)一張照片。當(dāng) Hylak 拿照片詢問(wèn) o1 時(shí)，o1 的回答通常與正確答案驚人地接近（約 60%）。對(duì)于醫(yī)療專業(yè)人員來(lái)說(shuō)更有用 ——o1 幾乎總能提供極其準(zhǔn)確的鑒別診斷。
解釋概念：Hylak 發(fā)現(xiàn) o1 非常擅長(zhǎng)通過(guò)示例解釋非常困難的工程概念。
在制定困難的架構(gòu)決策時(shí)，Hylak 經(jīng)常會(huì)讓 o1 生成多個(gè)計(jì)劃，甚至比較這些計(jì)劃，每個(gè)計(jì)劃都有優(yōu)缺點(diǎn)。
評(píng)估：Hylak 一直對(duì)使用 LLM 作為評(píng)估的判別器持非常懷疑的態(tài)度，但 o1 表現(xiàn)出巨大的希望 —— 它通常能夠在很少的上下文下確定生成結(jié)果是否正確。

o1 做得還不夠好的地方：

用特定的聲音 / 風(fēng)格寫作：Hylak 發(fā)現(xiàn) o1 不擅長(zhǎng)寫任何東西，尤其是在特定的聲音或風(fēng)格中。它遵循一種非常學(xué)術(shù) / 企業(yè)的報(bào)告風(fēng)格。

Hylak 嘗試讓 o1 寫這篇博客的一個(gè)例子 — — 經(jīng)過(guò)多次反復(fù)，它只會(huì)寫一份平淡的報(bào)告。

構(gòu)建整個(gè)應(yīng)用程序：o1 非常擅長(zhǎng)一次性構(gòu)建整個(gè)文件，但 o1 不會(huì)構(gòu)建整個(gè) SaaS，至少不會(huì)進(jìn)行大量迭代。不過(guò)，它幾乎可以一次性完成整個(gè)功能，特別是前端功能或簡(jiǎn)單的后端功能。

延遲從根本上改變了我們對(duì)產(chǎn)品的體驗(yàn)?？紤]一下電子郵件和短信之間的區(qū)別 —— 主要是延遲，語(yǔ)音消息與電話通話 —— 延遲，等等。

Hylak 將 o1 稱為「報(bào)告生成器」，因?yàn)?o1 顯然不是聊天模型 —— 它感覺(jué)更像電子郵件。

Hylak 認(rèn)為 o1 將首次使某些產(chǎn)品成為可能 —— 例如，可以從高延遲、長(zhǎng)時(shí)間運(yùn)行的后臺(tái)智能中受益的產(chǎn)品。

用戶愿意等待 5 分鐘來(lái)完成什么樣的任務(wù)？一個(gè)小時(shí)？一天？3-5 個(gè)工作日？如果設(shè)計(jì)正確的話，有很多。

需要注意的是，o1-preview 和 o1-mini 支持流式傳輸，但不支持結(jié)構(gòu)化生成或系統(tǒng)提示。o1 支持結(jié)構(gòu)化生成和系統(tǒng)提示，但尚不支持流式傳輸。

當(dāng)開發(fā)人員在 2025 年設(shè)計(jì)產(chǎn)品時(shí)，實(shí)際使用該模型做什么將會(huì)非常重要。

責(zé)任編輯：姜華來(lái)源：機(jī)器之心

人工智能 OpenAI o1

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板：午夜在线小视频 | 欧美一区二区三区在线观看 | 91精品久久久久久久久久 | 99久久久久 | 羞羞的视频在线看 | 成人在线精品视频 | www.久久久久久久久久久 | 久久久久久国产精品mv | 精品一区二区三区免费毛片 | 欧美视频在线观看 | 免费在线视频一区二区 | 亚洲视频免费在线播放 | 99国产视频| 亚洲精品电影在线观看 | 国产精品国产三级国产aⅴ无密码 | 国产免费视频 | 水蜜桃久久夜色精品一区 | 日韩中文字幕一区二区 | 久久久精品一区二区三区四季av | 久久久久精| 永久免费视频 | 一级黄色短片 | 精品视频一区二区三区 | www亚洲精品| 久久看看 | 欧美精品在线免费 | 欧美日韩综合视频 | 天天干天天爽 | 亚洲男人天堂 | 日韩成人在线播放 | 狠狠综合久久av一区二区老牛 | 亚洲成人自拍 | 国产一区二区三区在线看 | 欧美不卡 | 99成人精品 | 91精品中文字幕一区二区三区 | 欧美一级精品片在线看 | 日韩欧美成人一区二区三区 | 国产精品国产精品国产专区不卡 | 免费视频久久久久 | 成人午夜电影网 |

<button id="ymkcw"><dl id="ymkcw"></dl></button>

<dl id="ymkcw"><acronym id="ymkcw"></acronym></dl><button id="ymkcw"><input id="ymkcw"></input></button>

<rt id="ymkcw"></rt>

<rt id="ymkcw"></rt>

<li id="ymkcw"></li>

<li id="ymkcw"><dl id="ymkcw"></dl></li><cite id="ymkcw"></cite>

<bdo id="ymkcw"><source id="ymkcw"></source></bdo>

<abbr id="ymkcw"></abbr>