成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

號稱全球最強開源 AI 模型,DBRX 登場:1320 億參數,語言理解、編程能力等均超 GPT-3.5

開源 人工智能
初創公司 Databricks 近日發布公告,推出了開源 AI 模型 DBRX,聲稱是迄今為止全球最強大的開源大型語言模型,比 Meta 的 Llama 2 更為強大。

3 月 28 日消息,初創公司 Databricks 近日發布公告,推出了開源 AI 模型 DBRX,聲稱是迄今為止全球最強大的開源大型語言模型,比 Meta 的 Llama 2 更為強大。

DBRX 采用 transformer 架構,包含 1320 億參數,共 16 個專家網絡組成,每次推理使用其中的 4 個專家網絡,激活 360 億參數。

Databricks 在公司博客文章中介紹,在語言理解、編程、數學和邏輯方面,對比 Meta 公司的 Llama 2-70B、法國 MixtralAI 公司的 Mixtral 以及馬斯克旗下 xAI 開發的 Grok-1 等主流開源模型,DBRX 均優勢勝出。

圖 1:DBRX 在語言理解 (MMLU)、編程 (HumanEval) 和數學 (GSM8K) 方面的表現優于已有的開源模型。

語言理解方面,DBRX 的分值為 73.7%,高于 GPT-3.5 的 70.0%、高于 Llama 2-70B 的 69.8%、Mixtral 的 71.4% 以及 Grok-1 的 73.0%。

模型

DBRX Instruct

Mixtral Instruct

Mixtral Base

LLaMA2-70B Chat

LLaMA2-70B Base

Grok-11

Open LLM Leaderboard2

(Avg of next 6 rows)

74.5%

72.7%

68.4%

62.4%

67.9%

ARC-challenge 25-shot

68.9%

70.1%

66.4%

64.6%

67.3%

HellaSwag 10-shot

89.0%

87.6%

86.5%

85.9%

87.3%

MMLU 5-shot

73.7%

71.4%

71.9%

63.9%

69.8%

73.0%

Truthful QA 0-shot

66.9%

65.0%

46.8%

52.8%

44.9%

WinoGrande 5-shot

81.8%

81.1%

81.7%

80.5%

83.7%

GSM8k CoT 5-shot maj@13

66.9%

61.1%

57.6%

26.7%

54.1%

62.9% (8-shot)

Gauntlet v0.34

(Avg of 30+ diverse tasks)

66.8%

60.7%

56.8%

52.8%

56.4%

HumanEval5

0-Shot, pass@1

(Programming)

70.1%

54.8%

40.2%

32.2%

31.0%

63.2%

編程能力方面,DBRX 的得分為 70.1%,遠超 GPT-3.5 的 48.1%,高于 Llama 2-70B 的 32.3%、Mixtral 的 54.8% 以及 Grok-1 的 63.2%。

Model

DBRX
Instruct

GPT-3.57

GPT-48

Claude 3 Haiku

Claude 3 Sonnet

Claude 3 Opus

Gemini 1.0 Pro

Gemini 1.5 Pro

Mistral Medium

Mistral Large

MT Bench (Inflection corrected, n=5)

8.39 ± 0.08

8.41 ± 0.04

8.54 ± 0.09

9.03 ± 0.06

8.23 ± 0.08

8.05 ± 0.12

8.90 ± 0.06

MMLU 5-shot

73.7%

70.0%

86.4%

75.2%

79.0%

86.8%

71.8%

81.9%

75.3%

81.2%

HellaSwag 10-shot

89.0%

85.5%

95.3%

85.9%

89.0%

95.4%

84.7%

92.5%

88.0%

89.2%

HumanEval 0-Shot
pass@1
(Programming)

70.1%

temp=0, N=1

48.1%

67.0%

75.9%

73.0%

84.9%

67.7%

71.9%

38.4%

45.1%

GSM8k CoT maj@1

72.8% (5-shot)

57.1% (5-shot)

92.0% (5-shot)

88.9%

92.3%

95.0%

86.5%

(maj1@32)

91.7% (11-shot)

66.7% (5-shot)

81.0% (5-shot)

WinoGrande 5-shot

81.8%

81.6%

87.5%

88.0%

86.7%

在數學方面,DBRX 的得分為 66.9%,高于 GPT-3.5 的 57.1%,也高于 Llama 2-70B 的 54.1%、Mixtral 的 61.1% 和 Grok-1 的 62.9%。

Databricks 介紹,DBRX 是一個基于 MegaBlocks 研究和開源項目構建的混合專家模型 (MoE),因此每秒輸出 token 的速度極快。Databricks 相信,這將為 MoE 未來最先進的開源模型鋪平道路。

IT之家附上參考地址

責任編輯:龐桂玉 來源: IT之家
相關推薦

2023-06-27 09:14:52

微軟LLM AI 模型

2023-12-12 13:57:00

GPT-3.5MistralAI

2023-10-16 13:28:00

數據AI

2024-11-12 14:00:00

AI編程

2023-07-22 13:09:51

模型開源

2023-03-15 10:26:00

模型開源

2023-07-28 16:35:26

代碼模型

2023-09-18 16:24:33

數據研究

2024-05-07 11:42:54

MoE模型GPT-4

2023-10-31 15:26:02

阿里云通義千問

2024-07-19 09:26:12

2023-10-30 14:59:28

2025-02-28 08:20:00

2023-04-28 09:07:28

2024-07-24 11:30:04

2023-12-14 13:04:00

訓練數據

2024-10-06 09:00:00

AI訓練數據

2025-02-19 09:34:01

2025-04-14 09:17:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美日韩电影一区二区 | 91啪亚洲精品| 亚洲福利在线观看 | 一区二区三区欧美 | 一区二区在线免费观看 | 亚洲视频一 | 欧美区日韩区 | 三级在线免费观看 | 91热爆在线观看 | 青青草一区 | 日韩欧美久久 | 亚洲视频精品在线 | 日韩在线中文字幕 | 91av视频在线免费观看 | 久久亚洲一区二区三区四区 | 亚洲视频在线播放 | 亚洲视频在线观看免费 | 精品亚洲一区二区 | 亚洲成人一区二区三区 | 日韩一区欧美一区 | 国产成人99久久亚洲综合精品 | 欧美网站一区 | 欧美极品在线观看 | 欧美中文字幕一区二区三区亚洲 | 亚洲成人av在线 | 亚洲精品久久久 | 99爱国产 | 国产精品三级久久久久久电影 | 美女福利视频一区 | 久久久久久国产精品免费免费狐狸 | 成人精品一区二区三区中文字幕 | 成人黄色在线视频 | 亚洲一区二区三区在线播放 | 老头搡老女人毛片视频在线看 | 在线免费观看日本 | 日韩av一区二区在线观看 | 成人国产精品免费观看 | 亚洲二区在线观看 | 国产精品99一区二区 | 伊人网在线综合 | 九九在线|