成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

開源模型首勝GPT-4!競技場最新戰報引熱議,Karpathy:這是我唯二信任的榜單

人工智能
1040億參數開源模型Command R+攀升至第6位,與GPT-4-0314打成平手,超過了GPT-4-0613。

能打得過GPT-4的開源模型出現了!

大模型競技場最新戰報:

1040億參數開源模型Command R+攀升至第6位,與GPT-4-0314打成平手,超過了GPT-4-0613。

圖片圖片

這也是第一個在大模型競技場上擊敗GPT-4的開放權重模型。

大模型競技場,可是大神Karpathy口中唯二信任的測試基準之一。

圖片圖片

Command R+來自AI獨角獸Cohere。這家大模型創業公司的聯合創始人兼CEO,正是Transformer最年輕作者Aidan Gomez(簡稱割麥子)。

圖片圖片

這份戰報一出,又掀起了一波大模型社區的熱烈討論。

大家伙兒興奮的理由很簡單:基礎大模型卷了一整年,沒想到在2024年格局還在不斷地發展變化。

HuggingFace聯合創始人Thomas Wolf就說:

最近大模型競技場上的情況發生了巨大的變化:

Anthropic的Claude 3 opus在閉源模型中獨占鰲頭。

Cohere的Command R+則成為了開源模型中的最強者。

沒想到,2024年在開源和閉源兩條路線上,人工智能團隊的發展都如此之快。

圖片圖片

另外,Cohere機器學習總監Nils Reimers還指出了值得關注的一點:

Command R+最大的特色是對內置RAG(檢索增強生成)進行了全面優化,而在大模型競技場中,RAG這樣的外掛能力并未納入測試。

圖片圖片

RAG優化模型登上開源王座

在Cohere官方定位中,Command R+是一個“RAG優化模型”。

就是說,這個1040億參數的大模型主要針對檢索增強生成技術進行了深度優化,以減少幻覺的產生,更適配于企業級工作負載。

和此前推出的Command R一樣,Command R+的上下文窗口長度是128k。

此外,Command R+還具備以下特點:

  • 覆蓋10+種語言,包括英語、中文、法語、德語等;
  • 能使用工具完成復雜業務流程的自動化

從測試結果來看,在多語種、RAG和工具使用這三個維度上,Command R+都達到了GPT-4 turbo的水平。

但在輸入成本方面,Command R+的價格僅為GPT-4 turbo的1/3。

輸出成本方面,Command R+則是GPT-4 turbo的1/2。

圖片圖片

正是這點引發了不少網友的關注:

圖片圖片

不過,盡管在大模型競技場這種人類主觀評測上表現搶眼,還是有網友甩出了一些不同觀點。

在HumanEval上,Command R+的代碼能力就連GPT-3.5都沒打過,在兩組測試中分別排在32位和33位。

最新版GPT-4 turbo則沒有懸念地拿下了第一。

圖片圖片

另外,我們也在最近剛登上正經論文的弱智吧benchmark上簡單測試了一下Command R+的中文能力。

圖片圖片

你給打個分?

需要說明的是,Command R+的開源只面向學術研究,并不能免費商用。

One More Thing

最后的最后,還是多聊一嘴割麥子小哥。

Aidan Gomez,Transformer圓桌騎士中最年輕的一位,加入研究團隊時只是個本科生——

不過,是在多倫多大學讀大三時就加入了Hinton實驗室的那種。

2018年,割麥子被牛津大學錄取,開始像他的論文搭子們那樣攻讀CS博士學位。

但在2019年,隨著Cohere的創立,他最終選擇退學加入AI創業的浪潮。

Cohere主要是為企業提供大模型解決方案,目前估值達到了22億美元。

參考鏈接:
[1]https://twitter.com/lmsysorg/status/1777630133798772766[2]https://txt.cohere.com/command-r-plus-microsoft-azure/

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-04-22 08:40:00

LLM模型開源

2024-08-08 13:03:46

2024-10-16 15:07:57

2024-03-08 13:02:56

Claude 3GPT-4Opus

2024-04-12 14:15:32

GPT-4AI機器人

2024-03-27 15:37:24

2024-12-13 14:03:44

模型訓練AI

2025-02-17 12:24:43

2024-06-24 18:15:22

2012-05-31 14:20:14

2024-07-24 12:40:44

2024-05-31 14:23:15

2024-01-01 22:28:52

2025-02-18 15:09:07

2023-05-29 15:46:59

2025-04-14 09:06:00

2023-03-28 13:01:20

GPT-4開發OpenAI

2023-08-27 12:54:59

GPT-4神秘版本Code

2024-07-29 15:37:17

AI訓練

2024-05-20 08:40:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 福利视频日韩 | 日韩欧美一区二区三区 | 在线国产一区二区三区 | 在线观看av网站永久 | 欧美日一区 | 婷婷成人在线 | 夜夜骑首页 | 国产精品视频二区三区 | 久久99久久99精品免视看婷婷 | 天堂精品| 国产96在线 | 欧美一区在线视频 | 午夜视频一区二区 | 亚洲精品免费在线 | 毛片网站免费观看 | 亚洲国产一区二区在线 | 午夜天堂精品久久久久 | www在线视频 | 成人激情视频免费在线观看 | 成人精品国产免费网站 | 波霸ol一区二区 | 中文字幕国产第一页 | 在线观看视频中文字幕 | 精品一区二区三区免费毛片 | 欧美成人一级视频 | 日本久久综合网 | 国产乱码精品一区二区三区中文 | 久色视频在线 | 99这里只有精品视频 | 免费视频一区二区三区在线观看 | 麻豆av一区二区三区久久 | 国产精品欧美一区二区三区 | 国产美女精品视频 | 国产亚洲一区二区精品 | 大香网伊人 | 95国产精品 | 成人欧美一区二区三区黑人孕妇 | 国产 日韩 欧美 中文 在线播放 | 色中文在线| 嫩草最新网址 | 中日韩毛片|