成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

UC伯克利「LLM排位賽」結果出爐!Claude 3追平GPT-4并列第一

人工智能 新聞
Claude 3不但數據集跑分領先,用戶體驗上也將成為最強大的LLM,GPT-5在哪里?

Claude 3和GPT-4到底誰厲害?

自從Claude 3發布以來,Anthropic官方對外宣稱的說法就是「全面超越GPT-4」,在技術報告中給出的各個測試集的數據來看,也都幾乎穩壓GPT-4-Turbo一頭。

但之前的新模型出來都要在跑分上「吊打」GPT-4,但實際體驗卻很少有真的能和GPT-4掰手腕的。

各行各業用戶試用過Claude 3,發現體驗似乎也比GPT-4要好。

在通過人類用戶打分進行排名的lmsys LLM Arena中,Claude 3在不斷積累了真實用戶反饋分數之后,排名不斷爬升。

眾所周知,這個排行榜因為是基于人類對于大模型回答的真實感受打分來排名的,對于越早初現的LLM,就能積累越多的評價,分數也越容易刷高。

所以之前出現了Claude 1.0排名高于Claude 2.0的情況,就是因為如果提升不明顯,先發布的模型得分會更有優勢。

而距離Claude 3發布一個多星期的時間,它就已經和發布了幾個月的GPT-4最新版并列第一了。

而且Claude 3大杯也超過了香草版的GPT-4。

因為LLM Arena評分系統對于先推出的模型有偏愛,所以按照這個趨勢發展下去,Claude 3超過GPT-4,在用戶體驗上排名第一似乎只是一個時間問題了。

Claude 3也終于能讓Anthropic在這個榜上打破之前的「新模型不如舊模型」的擠牙膏魔咒,徹底為自己的能力正名。

Claude 3出乎意料的用例

Claude 3和GPT-4比數學

這位網友設計了一個小實驗,來比較兩者的算數能力,Claude 3 Opus在數字上比GPT-4好得多!

9-10位數的加減法算數,Opus的整體準確率達到100%。

隨著測試用例變得更加復雜,GPT-4 開始出錯。GPT-3.5被徹底碾壓了。

所有模型的乘法能力都不太行,但Opus表現最好,把GPT-4遠遠甩在了后邊。

Opus是唯一能在5位數乘法上具有非零精度,并且在一般乘法上具有更好分數的模型。

因為Claude 3會像人類一樣做乘法,并使用其他技巧來簡化。

圖片

圖片

這個用例中,可以實打實地看到Claude 3和GPT-4強大的地方。

讓Claude 3翻譯古文物上的語言

網友突發奇想,找了一個古代文物,讓Claude 3來嘗試翻譯斐斯托圓盤?

這是一件神秘的古代文物,由意大利考古學家Luigi Pernier于1908年在費斯托斯的米諾斯宮殿中發現。

- 直徑為15厘米(5.9 英寸):

圖片

學者對翻譯斐斯托斯圓盤進行了很多嘗試,從宗教文件、日歷、游戲,甚至樂譜的角度來理解它的內容,都沒有成功。

圖片

網友先嘗試讓Claude 3明白自己要做什么?用提示詞讓他明白需要去把一些意義不明的符號歸納出能夠被理解的內容。

圖片

然后網友向Claude提供了一些現成的信息,讓他明白了迄今為止對費斯托圓盤的了解。

信息主要來自維基百科。

如果你要求它直接翻譯或者破譯內容,它會拒絕。

但是網友讓他做一些推測性的翻譯,Claude 3突然就開始干活了。

A面翻譯:

「偉大的女神(標志 02)為城市/宮殿(標志 24)提供保護(標志 12)。人們(標志 01)帶來祭品(標志 11、27)并在她的體內進行神圣儀式(標志 13、18)榮譽。女神的祝福(標志 35、38)確保了這片土地的繁榮(標志 28)和勝利(標志 02、12)。」

B面翻譯:

「統治者(標志 07)帶領戰士(標志 22、08)進行一場偉大的戰斗(標志 25、45)。敵人(標志 29)被擊敗(標志 24、07),勝利的軍隊(標志 22、 07)返回家園(標志23)。眾神(標志06、09)對供品(標志27、39)感到滿意,并給予土地(標志40)祝福(標志35、36)。」

現在,讓我們將 A 面和 B 面結合起來。

「在偉大女神(標志 02)祝福的土地上,人們(標志 01)生活在她神圣的保護之下(標志 12)。他們將供品(標志 11、27)帶到她神圣的宮殿(標志 24)并進行神圣的儀式。儀式(征兆 13、18)來紀念她的名字。女神將她的恩惠(征兆 35、38)賜予這片土地,賜予繁榮(征兆 28)和富足。

當敵人(標志29)威脅和平時,強大的統治者(標志07)聚集勇敢的戰士(標志22、08)來保衛王國。在一場激烈的戰斗(征兆25、45)中,他們戰勝了敵人(征兆24、07)并凱旋(征兆22、07)回到自己的家園(征兆23)。諸神(征兆 06、09)向勝利的英雄微笑,并接受他們感激的奉獻(征兆 27、39)。

在神的祝福(征兆 35、36)下,土地(征兆 40)再次繁榮。人們贊美偉大的女神和英勇的統治者,因為他們的忠誠和勇氣贏得了上天的青睞。就這樣,在女神永恒的保護和人們堅定不移的信仰下,生命的循環繼續下去,世世代代如此,未來也將如此。」

再讓他把內容中的各個名詞做了解釋:

神:解釋中提到的「偉大女神」可能是米諾斯母神,例如「蛇女神」或希臘女神瑞亞的前身,瑞亞與生育和保護有關。

統治者:解釋中的「強大的統治者」可能代表米諾斯國王或克里特神話中的傳奇人物,例如米諾斯國王,據說他統治了克里特島并委托建造了著名的迷宮。

王國:故事中的王國可能是指古代克里特島本身,在青銅時代擁有繁榮的城市和先進的文明,例如克諾索斯、斐斯托斯或馬利亞。

人民:解釋中提到的「人民」可能代表米諾斯人民,以其復雜的藝術、建筑和宗教習俗而聞名。

戰爭:推測翻譯中描述的「激烈的戰斗」可能暗指克里特島與鄰國之間的歷史沖突,例如來自希臘大陸的邁錫尼人,或者神話中的戰斗,例如忒修斯與牛頭怪之間的戰斗。

而當網友要求Claude應用A面和克里特島象形文字做比較,再把斐斯托斯圓盤符號和其他米諾斯文字之間的一對一映射。

Claude給出了它的理解:

偉大的宮殿(標志 24,類似于線性 A 標志 041「宮殿」)在這對神圣夫婦的注視下高高矗立(標志 02 和 06,類似于線性 A 標志 038「神」和 037「女神」)。神圣的公牛(符號 28,類似于克里特島象形文字 012「公牛」)被用來獻祭(符號 27,類似于線性 A 符號 031「奉獻」),以確保上天的青睞。

勇敢的戰士(符號 08,類似于克里特島象形文字 059「戰士」)起航(符號 25,類似于線性 A 符號 086「船」)保衛王國的邊界。憑借雙斧的力量(符號13,類似于克里特象形文字042「雙斧」)和神圣盾牌的保護(符號12,類似于克里特象形文字024「盾牌」),他們戰勝了敵人(符號29,類似到線性A標志080「敵人」)并勝利歸來。

明智的統治者(符號07,類似于線性A符號038「主」)和貴族女士(符號09,類似于線性A符號037「女士」)監督著土地的繁榮。豐富的收成(符號35,類似于線性A符號031「谷物」)和熟練的手工藝(符號19,類似于克里特島象形文字054「工匠」)給人們帶來了財富和歡樂。

神圣的文字(符號41,類似于線性A符號070「文字」)在圣殿(符號23,類似于克里特島象形文字057「神廟」)中被背誦,以維持宇宙秩序。生命、死亡和重生的永恒循環(標志10、11和34,類似于線性A標志010「生命」、036「死亡」和057「出生」)在不朽者的指導下繼續進行。」

用Claude 3來將自己的創意分解為可操作的創業規劃

這個初創公司的CEO分享了兩個他個人非常常用的Claude提示詞,一個可以幫助普通人來檢驗自己的想法能不能變成可以賺錢的生意,一個可以來讓Claude在某個自己不熟悉的領域來做一些工程上的決定。

當然,他的提示詞是用的英文,但是為了方便大家理解,我們做了翻譯。

如果有自己不熟悉的領域的知識需要快速理解,這個Claude 3的提示詞也可以幫上忙。

除了生成商業計劃和工程方面的建議,按照這個思路可以讓他做很多專業化的處理工作。

以下是他通過這個提示詞獲得的結果。

可以看出,Claude能嚴格按照你設置的格式和要求來回答你的問題。

圖片

用Claude 3編寫一段解釋勾股定理的代碼

提示是:「編寫 manim 代碼來動畫解釋畢達哥拉斯定理。在編碼之前一步步思考并向我提供完整的代碼」

雖然它并沒有在第一次嘗試中為我提供完全完美的代碼,但這是一個非常好的開始。

不過小哥也承認,剛開始Claude 3生成的代碼是有Bug的,他花了幾分鐘改了之后才能運行出這個動畫。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-06-21 13:20:14

系統模型

2024-03-28 14:26:51

人工智能

2023-05-16 13:32:23

模型排行

2023-05-31 16:15:51

模型圖像

2024-11-26 13:40:00

2024-04-07 00:45:00

開源模型

2023-08-14 08:04:13

2023-07-15 23:54:57

GPT-4AI谷歌

2024-02-19 13:46:04

多模態信息LWMtoken

2024-12-18 07:20:00

2023-06-08 11:27:10

模型AI

2023-11-14 07:47:42

IGN擴散模型

2024-05-30 14:23:00

2025-01-22 15:21:00

2025-06-03 08:38:00

2013-10-29 16:12:08

2024-12-02 08:20:00

2023-11-02 12:10:00

AI訓練

2024-01-29 10:31:00

AI模型

2023-04-07 09:28:31

模型訓練
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲欧美日韩精品久久亚洲区 | 免费在线一区二区三区 | 武道仙尊动漫在线观看 | 国产精品夜夜春夜夜爽久久电影 | 久久99精品久久久久久国产越南 | 久久一级大片 | 亚洲精品一区二区三区免 | 可以免费观看的av | 精品亚洲一区二区 | 黄色网毛片 | 久久久精 | 欧美日韩综合视频 | 国产精品一区二区三区在线 | 亚洲女优在线播放 | 国产精品国产a级 | 国产精品一区二区av | 黄色毛片在线看 | 亚洲成人中文字幕 | 91精品久久久久久久 | 日韩国产中文字幕 | 成人午夜看片 | 影音先锋成人资源 | 精久久久 | 欧美日韩国产精品一区二区 | 国产婷婷综合 | 一级做a爰片性色毛片视频停止 | 久久成人一区 | 国产精品久久久久久久久久妇女 | 中文字幕黄色大片 | 99视频网站| 日日摸日日碰夜夜爽亚洲精品蜜乳 | 亚洲精品天堂 | 日韩在线看片 | 久久精品一区二区三区四区 | 欧美一区二区三区四区五区无卡码 | 一区二区免费 | 夜夜草| 日韩爱爱网站 | 亚洲精品乱码久久久久v最新版 | 国产三级电影网站 | 国产精品亚洲精品 |