成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

卷瘋了！開(kāi)源社區(qū)離Openai o1越來(lái)越近~

發(fā)布于 2024-10-9 13:05

瀏覽

0收藏

小長(zhǎng)假結(jié)束了~ 本來(lái)打算梳理一下假期的信息的，但是內(nèi)容有點(diǎn)多，放棄了~

今天這個(gè)標(biāo)題對(duì)應(yīng)假期的2個(gè)新聞。

思科的大佬，假期發(fā)了一篇medium博客，使用2個(gè)復(fù)雜數(shù)據(jù)集，進(jìn)行了一系列模型的基準(zhǔn)測(cè)試。
Blog: https://medium.com/@harishhacker3010/can-we-make-any-smaller-opensource-ai-models-smarter-than-human-1ea507e644a0
Prompt: https://gist.github.com/philschmid/34747bf5bc8280f3a5f10f5fd8d1cd4b
Github: https://github.com/harishsg993010/LLM-Research-Scripts

簡(jiǎn)單總結(jié)

?? 結(jié)合動(dòng)態(tài)思維鏈+反思+語(yǔ)言強(qiáng)化promp，以嚴(yán)格的學(xué)術(shù)測(cè)試為基準(zhǔn)（JEE Advanced、UPSC、IMO、Putnam）
?? Claude 3.5 Sonnet 的性能優(yōu)于 GPT-4 和匹配的 O1 型號(hào)
?? LLMs可以創(chuàng)建內(nèi)部模擬并對(duì)復(fù)雜問(wèn)題采取 50 多達(dá)推理步驟
?? 適用于較小的開(kāi)源模型，如 Llama 3.1 8B +10%（Llama 3.1 8B 33/48 與 GPT-4o 36/48）
? 由于計(jì)算和預(yù)算限制，沒(méi)有像 MMLU、MMLU pro 或 GPQA 那樣進(jìn)行基準(zhǔn)測(cè)試
?? 高token使用量 - Claude Sonnet 3.5 僅 7 個(gè)問(wèn)題就使用了大約 100 萬(wàn)個(gè)令牌

open o1 項(xiàng)目

github: https://github.com/OpenSource-O1/Open-O1
space: https://huggingface.co/spaces/happzy2633/open-o1
hf: https://huggingface.co/O1-OPEN

Open-O1 項(xiàng)目，主要是期望對(duì)齊閉源 OpenAI O1 模型的強(qiáng)大功能，為社區(qū)提供先進(jìn)的開(kāi)源替代方案。通過(guò)精心篩選一組 O1 風(fēng)格的思考數(shù)據(jù)來(lái)開(kāi)發(fā)訓(xùn)練，這些數(shù)據(jù)用于訓(xùn)練 LLaMA 和 Qwen 模型。這種訓(xùn)練方法賦予了較小的模型長(zhǎng)期推理和解決問(wèn)題的能力。

有一些初步的微調(diào)成果，但是看起來(lái)不太顯著，readme上有挺多不錯(cuò)的輸出樣例。開(kāi)源模型：https://huggingface.co/happzy2633/qwen2.5-7b-ins-v3/tree/main

卷瘋了！開(kāi)源社區(qū)離Openai o1越來(lái)越近~-AI.x社區(qū)

本文轉(zhuǎn)載自 ??NLP前沿??，作者：熱愛(ài)AI的

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

2024年的百度大模型，離「錢(qián)」越來(lái)越近

liutao988 ? 2920瀏覽 ? 0回復(fù)
Open LLM集中爆發(fā)的一周，卷瘋了！

PaperAgent ? 2498瀏覽 ? 0回復(fù)
剛剛，OpenAI發(fā)布史上最強(qiáng)模型-o1，推理能力超人類(lèi)博士！

Aceryt ? 2725瀏覽 ? 0回復(fù)
OpenAI o1很強(qiáng)，也能被玩壞！

PaperAgent ? 2588瀏覽 ? 0回復(fù)
OpenAI發(fā)布新模型：o1系列模型，更像理科生的模型

大語(yǔ)言模型論文跟蹤 ? 4342瀏覽 ? 0回復(fù)
使用 OpenAI o1 的五種方法「詳細(xì)指南」

51CTO技術(shù)棧 ? 5825瀏覽 ? 0回復(fù)
OpenAI o1推理模型基礎(chǔ)入門(mén)

51CTO內(nèi)容精選 ? 2510瀏覽 ? 0回復(fù)
OpenAI o1：用內(nèi)部思維鏈進(jìn)行復(fù)雜推理

shizhi02 ? 2661瀏覽 ? 0回復(fù)
擊敗GPT-4o、僅次于o1！英偉達(dá)重磅開(kāi)源超強(qiáng)大模型--Nemotron

Aceryt ? 3325瀏覽 ? 0回復(fù)
向o1看齊，Google開(kāi)源RAG推理擴(kuò)展，提升近60%

NLP前沿1 ? 2224瀏覽 ? 0回復(fù)
OpenAI o1 模型到來(lái)后，談?wù)勌崾驹~工程的未來(lái)

Baihai_IDP ? 2374瀏覽 ? 0回復(fù)
Nature: LLM變得越來(lái)越像大腦

ceesoft ? 2304瀏覽 ? 0回復(fù)
開(kāi)源版o1！中國(guó)大模型讓國(guó)外陷入瘋狂，成本猛降90%

Aceryt ? 3257瀏覽 ? 0回復(fù)
Kimi深夜炸場(chǎng)：滿血版多模態(tài)o1級(jí)推理模型！OpenAI外全球首次！Jim Fan：同天兩款國(guó)產(chǎn)o1絕對(duì)不是巧合！

51CTO技術(shù)棧 ? 2292瀏覽 ? 0回復(fù)
DeepSeek R1橫空出世，超越OpenAI o1，教你用Ollama跑起來(lái)

小虎哦哦 ? 1.5w瀏覽 ? 0回復(fù)
Kimik1.5、DeepSeek-V3 大戰(zhàn) OpenAI o1，誰(shuí)能笑到最后？

智駐未來(lái) ? 5995瀏覽 ? 0回復(fù)
DeepSeek R1 Vs OpenAI o1！全球頂級(jí)推理模型訓(xùn)練技術(shù)對(duì)比大解密！

51CTO技術(shù)棧 ? 6095瀏覽 ? 0回復(fù)
Vision-R1：多模態(tài)領(lǐng)域的DeepSeek R1-Zero，7B參數(shù)比肩OpenAI O1

Syrupup ? 2365瀏覽 ? 0回復(fù)
阿里扔出王炸：全球首個(gè)開(kāi)源全模態(tài)大模型Qwen2.5-Omni：7B搞定看聽(tīng)說(shuō)寫(xiě)，AI越來(lái)越像人了

算家計(jì)算 ? 1821瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

阿里開(kāi)源VRAG-RL：定義下一代檢索增強(qiáng)生成 2025-06-16 07:56:18發(fā)布
RAG應(yīng)用要如何吃到大模型長(zhǎng)上下文的紅利？-LongRAG 2025-06-04 06:19:46發(fā)布

熱門(mén)推薦

AI Agents開(kāi)源工具棧全解析~ 1回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題 0回復(fù)

Deepseek R1 0528實(shí)測(cè)：性能直逼頂尖，普通電腦本地運(yùn)行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測(cè)：真·超DS！ 1回復(fù)

DeepSeek 新模型 R1-0528 悄悄開(kāi)源，與o3 相當(dāng)，實(shí)測(cè)來(lái)了 0回復(fù)

上一篇： Meta剛開(kāi)源llama 3.2多模態(tài)，就被打敗了！

下一篇：現(xiàn)實(shí)再次給大模型帶來(lái)沉重打擊

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：欧美精品一区二区三区四区五区 | 久久不卡 | 久在线视频播放免费视频 | 在线黄| 欧美日韩国产精品一区 | 国内精品久久久久久久 | 国产久| 日本精品久久久一区二区三区 | 亚洲成网 | 91精品国产综合久久久动漫日韩 | 亚洲欧美激情精品一区二区 | 成人免费视频网站在线看 | 欧美成人免费在线视频 | 精品毛片 | 久久精品欧美电影 | 国产欧美一区二区三区在线看 | 狠狠狠色丁香婷婷综合久久五月 | 成年人在线视频 | 亚洲高清视频在线观看 | 免费欧美| 欧美乱人伦视频 | 欧美综合一区二区三区 | 一区二区三区在线电影 | 91精品无人区卡一卡二卡三 | 天天综合日日夜夜 | 三级免费网 | 中文字幕av在线播放 | 亚洲视频免费在线 | 久久人人网 | 久久久久国产精品一区二区 | 开操网| 中文字幕在线一区二区三区 | 欧美精品一区在线 | 国产精品7777777| 国产精品成人一区二区 | 久久久久国产一区二区三区 | 日韩亚洲视频 | 精品国产三级 | 亚洲视频在线看 | 亚洲精品视频一区二区三区 | 国产精品视频在线观看 |