成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

不用等R2了!第三方給新版DeepSeek V3添加深度思考,推理101秒破解7米甘蔗過2米門

人工智能 新聞
現在,等不及DeepSeek官方,開源社區已經開始自己動手給V3-0324加入深度思考了。

DeepSeek即將發布R2??坊間傳聞越來越多了,且難辨真假。

1.2T萬億參數,5.2PB訓練數據,高效利用華為芯片……只能說如果有一半是真的都很牛了。

圖片

HuggingFace創始人此時推薦“以不變應萬變”,打開官方認證賬號的更新提醒,就能第一時間獲取通知。

圖片

拋開具體泄露數據是否準確,大家似乎有一個共識:如果真的有R2,它的基礎模型會是新版DeepSeek V3-0324。

之所以有很多人相信R2會在4月底發布,有一部分原因也是出于R1與V3之間相隔了一個月左右。

現在,等不及DeepSeek官方,開源社區已經開始自己動手給V3-0324加入深度思考了。

圖片

新模型DeepSeek-R1T-Chimera,能力與原版R1相當,但速度更快,輸出token減少40%,也是基于MIT協議開放權重。

相當于擁有接近R1的能力和接近V3-0324的速度,結合了兩者的優點。

圖片

而且做到這一點,不是靠微調或蒸餾,而是DeepSeek V3-0324和R1兩個模型融合而成。

R1+V3融合模型

新模型R1T-Chimera并非DeepSeek官方出品,而是來自德國團隊TNG Technology Consulting。

圖片

該團隊此前也探索過可調專家混合(MoTE)方法, 讓DeepSeek-R1在推理部署時可以改變行為。

圖片

新的R1T-Chimera模型權重可在HuggingFace下載,也可以在OpenRouter免費在線試玩。

目前已知是選用了V3-0324的共享專家+R1與V3-0324的路由專家的混合體融合而來。

圖片

TNG團隊表示最終結果令人驚訝,不僅沒有表現出融合模型的缺陷,相反,思考過程還比原版R1更緊湊有序。

圖片

暫沒有技術報告或更詳細的模型融合方法公布,要驗證它是否符合描述,就只能拉出來試一試了。

我們選用最新折磨AI的難題“7米長的甘蔗如何通過2米高1米寬的門?”。

原版R1思考了13秒就下了結論;R1T Chimera在這里卻足足思考了101秒,最終計算出可以通過。

雖然還是無法像人類一樣直觀的理解三維空間,讓甘蔗與門的平面垂直就可通過,但依然通過計算夾角與投影得出了結論。

圖片

在這100秒時間里R1T-Chimera如何一步步思考出答案呢?

展開推理token可以發現,在簡單計算二維方案不可行后,它就已經想到了三維方案。

圖片

后面依然陷入了各種誤區,在旋轉甘蔗、彎曲甘蔗、計算“門的厚度”上走了彎路。

圖片

最終通過“揣摩出題人心理”走進正確的路線。

圖片

最終給出的答案非常嚴謹了。

雖然人類直覺上就能想出把甘蔗垂直起來通過這個方法,但仔細一想,題目中確實沒有給出“門后有多少空間這個條件”。

圖片

細還是AI細。

關于R1T-Chimera的更多細節,大家還在等TNG團隊消息和更多第三方基準測試結果。

圖片

不過也有人注意到,KIMI K1.5技術報告中也探索了模型融合方法。

具體來說是把長思維鏈(long-cot)模型和短思維鏈(short-cot)模型融合,直接對兩個模型的權重取平均值,獲得一個新模型,無需重新訓練。圖片

不過在實驗中,這種簡單融合方法表現并不如這篇論文中提出的Long2short強化學習方法。

圖片

另一個在模型融合上有經驗的團隊是Transformer作者Llion Jones創辦的Sakana AI。

早在24年初就結合進化算法提出以block為單位融合的方法。

圖片

隨著更多團隊跟進這一路線,模型融合會不會成為2025年大模型的一大技術趨勢呢?


https://huggingface.co/tngtech/DeepSeek-R1T-Chimera

在線試玩:
https://openrouter.ai/tngtech/deepseek-r1t-chimera:free

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-03-25 09:28:21

2025-04-01 05:00:00

OAuth2服務器身份驗證

2022-01-14 09:57:14

鴻蒙HarmonyOS應用

2015-11-05 16:44:37

第三方登陸android源碼

2013-08-14 09:19:19

P2V

2025-02-26 11:16:18

2013-03-19 11:07:21

2021-09-10 10:13:27

Windows 10Windows微軟

2019-07-30 11:35:54

AndroidRetrofit

2014-07-23 08:55:42

iOSFMDB

2025-04-07 07:30:00

模型AI訓練

2023-03-01 07:21:33

2025-04-07 08:42:00

2019-09-03 18:31:19

第三方支付電商支付行業

2016-10-21 14:09:10

2009-12-31 14:38:34

Silverlight

2017-12-11 15:53:56

2023-07-07 13:32:03

第三方安全風險網絡安全

2018-03-12 13:47:27

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成年人免费看的视频 | 91社区视频 | 亚洲精品视频导航 | 人人cao | 在线免费小视频 | 91黄色免费看 | 精品免费国产视频 | 亚洲成人激情在线观看 | 天堂资源| 国产人久久人人人人爽 | www成年人视频| 久久av在线播放 | 日韩在线免费视频 | 亚洲高清在线 | 亚洲精品 在线播放 | 人人艹人人 | 人人干人人干人人 | 一级黄色av电影 | 国产高清在线 | 欧美一区永久视频免费观看 | 日韩欧美国产精品 | 日韩av在线一区 | 亚洲一区二区av | 亚洲iv一区二区三区 | 国产精品久久久久久久久久久久午夜片 | 一区二区三区在线 | 正在播放国产精品 | 国产日韩欧美激情 | 国产99视频精品免费播放照片 | 一区二区视屏 | 天天激情综合 | 天天想天天干 | 日韩高清中文字幕 | 久热中文字幕 | 狠狠色综合久久婷婷 | 成人二区 | 黄a网 | 黄网站涩免费蜜桃网站 | 日韩高清中文字幕 | 国产精品久久一区二区三区 | 国产精品久久久亚洲 |