成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

開源大模型新SOTA!支持免費(fèi)商用,比LLaMA65B小但更強(qiáng),基于1萬(wàn)億token

人工智能 新聞
最終性能超越650億的LLaMA,以及MPT、Redpajama等現(xiàn)有所有開源模型。

本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

號(hào)稱“史上最強(qiáng)的開源大語(yǔ)言模型”出現(xiàn)了。

圖片

它叫Falcon(獵鷹),參數(shù)400億,在1萬(wàn)億高質(zhì)量token上進(jìn)行了訓(xùn)練。

最終性能超越650億的LLaMA,以及MPT、Redpajama等現(xiàn)有所有開源模型。

圖片

一舉登頂HuggingFace OpenLLM全球榜單:

圖片

除了以上成績(jī),F(xiàn)alcon還可以只用到GPT-3 75%的訓(xùn)練預(yù)算,性能就顯著超越GPT-3,且推理階段的計(jì)算也只需GPT-3的1/5。

圖片

據(jù)悉,這只半路殺出來(lái)的“獵鷹”來(lái)自阿聯(lián)酋阿布扎比技術(shù)創(chuàng)新研究所(TII)。

有意思的是,作為一個(gè)開源模型,TII在Falcon上推出了一個(gè)相當(dāng)特別的授權(quán)許可證要求:

可以商業(yè)使用,但如果用它產(chǎn)生的收益超過(guò)了100萬(wàn)美元,就要被收取10%的授權(quán)費(fèi)。

一時(shí)之間,爭(zhēng)議滿滿。

史上最強(qiáng)開源LLM

據(jù)介紹,F(xiàn)alcon屬于自回歸解碼器模型。

它使用自定義工具構(gòu)建,包含一個(gè)獨(dú)特的數(shù)據(jù)管道,該管道從公開網(wǎng)絡(luò)中提取訓(xùn)練數(shù)據(jù)。

——Falcon宣稱它“特別注重?cái)?shù)據(jù)質(zhì)量”,從公網(wǎng)上抓取內(nèi)容構(gòu)建好Falcon的初始預(yù)訓(xùn)練數(shù)據(jù)集后,再使用CommonCrawl轉(zhuǎn)儲(chǔ),進(jìn)行大量過(guò)濾(包括刪除機(jī)器生成的文本和成人內(nèi)容)并消除重復(fù)數(shù)據(jù),最終得到一個(gè)由近5萬(wàn)億個(gè)token組成的龐大預(yù)訓(xùn)練數(shù)據(jù)集。

為了擴(kuò)大Falcon的能力,該數(shù)據(jù)集隨后又加進(jìn)了很多精選語(yǔ)料,包括研究論文和社交媒體對(duì)話等內(nèi)容。

除了數(shù)據(jù)把關(guān),作者還對(duì)Falcon的架構(gòu)進(jìn)行了優(yōu)化以提升性能,但細(xì)節(jié)沒(méi)有透露,相關(guān)論文將很快發(fā)布。

據(jù)悉,F(xiàn)alcon一共耗費(fèi)兩個(gè)月,在AWS的384個(gè)GPU上訓(xùn)練而成。

圖片

最終,F(xiàn)alcon一共包含4個(gè)版本:

  • Falcon-40B:在1萬(wàn)億token上進(jìn)行訓(xùn)練,并使用精選語(yǔ)料庫(kù)進(jìn)行了增強(qiáng);主要接受英語(yǔ)、德語(yǔ)、西班牙語(yǔ)、法語(yǔ)的訓(xùn)練,不會(huì)中文。
  • Falcon-40B-Instruct:在Baize上進(jìn)行了微調(diào),使用FlashAttention和多查詢對(duì)推理架構(gòu)進(jìn)行了優(yōu)化,是一個(gè)即用型聊天模型。
  • Falcon-7B:參數(shù)70億,在1.5萬(wàn)億token上進(jìn)行了訓(xùn)練,作為一個(gè)原始的預(yù)訓(xùn)練模型,還需要用戶針對(duì)大多數(shù)用例進(jìn)一步微調(diào)。
  • Falcon-RW-7B:參數(shù)70億,在3500億token上進(jìn)行訓(xùn)練,該模型旨在用作“研究神器”,單獨(dú)研究各種在網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行訓(xùn)練的影響。

開源許可證引爭(zhēng)議

Falcon作為開源模型,已公開源代碼和模型權(quán)重,可供研究和商業(yè)使用

這對(duì)業(yè)界來(lái)說(shuō)是一個(gè)好消息,畢竟像Meta的羊駝家族都只能用于研究目的,且還得填表格申請(qǐng)才行,很是麻煩。

但Falcon還是引起了爭(zhēng)議。

這主要是因?yàn)樗恰俺^(guò)100萬(wàn)美元的任何商業(yè)應(yīng)用都要收10%的授權(quán)費(fèi)”的許可證要求。

據(jù)悉,該許可證部分基于Apache License 2.0協(xié)議,該協(xié)議對(duì)商業(yè)應(yīng)用友好,使用者修改代碼只需滿足相關(guān)需求即可將新作品作為開源或商業(yè)產(chǎn)品發(fā)布或銷售。

圖片

有不少網(wǎng)友認(rèn)為,既然Falcon宣稱開源,還要收費(fèi),就違背了Apache License Version 2.0的宗旨,不屬于真正的開源。

圖片


圖片

并有人稱這是一種“有損Apache軟件基金會(huì)來(lái)之不易的名譽(yù)”的做法。

圖片

有網(wǎng)友已經(jīng)跑到TII的官方賬號(hào)下“討要說(shuō)法”:

你自己能解釋一下這是如何符合“開源”的定義嗎?

圖片

目前,官方并沒(méi)有回復(fù)。

你認(rèn)為這種做法究竟算不算開源呢?

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2023-02-28 07:03:09

AIMeta大型語(yǔ)言

2024-04-01 12:43:40

模型訓(xùn)練開源

2023-11-06 11:26:55

模型開源

2023-07-19 09:00:00

模型AI

2024-04-09 13:21:00

AI開源

2025-04-14 09:27:00

2023-08-07 13:40:39

AI模型

2023-07-19 12:09:36

大模型Llama 2扎克伯格

2024-05-13 08:00:00

MIT模型

2024-06-04 14:09:00

2024-08-19 08:45:00

開源模型

2023-09-11 13:28:00

AI模型

2024-05-30 13:10:10

2023-07-25 13:52:54

開源模型

2025-06-17 09:07:24

2023-09-07 13:25:00

AI模型

2024-04-02 09:17:50

AI數(shù)據(jù)開源

2023-07-25 11:17:32

阿里云Llama2大模型

2024-08-22 16:23:05

2023-08-07 12:52:04

模型免費(fèi)商用技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 久久亚洲精品国产精品紫薇 | 亚洲成人一区二区三区 | av男人的天堂av | 欧美一区二区三区久久精品 | 999精彩视频 | 激情婷婷 | 视频一区在线 | 欧美精品中文字幕久久二区 | 国产精品久久久久久久一区二区 | 色婷婷亚洲国产女人的天堂 | 日本视频在线 | 天天搞天天操 | 午夜三区 | 日韩av成人 | 日韩精品一区二区三区免费观看 | 日日爽 | 国产黄色大片 | 一级全黄视频 | 国产精品一区二区三区在线 | 日韩一区二区三区四区五区六区 | 在线第一页 | 亚洲在线看 | 国产成人99久久亚洲综合精品 | 国产精品久久久久久久久图文区 | 久久成人精品视频 | 午夜影视| 天天射影院 | 欧美成年视频 | 国产精品视频久久久久久 | 免费色网址 | 国产精品欧美一区二区三区不卡 | 黄色av网站免费看 | 精品乱子伦一区二区三区 | 亚洲欧美综合精品另类天天更新 | 中文字幕二区 | 国产在线一区二区三区 | 欧美激情综合 | 精品国产一区二区在线 | 日本在线视频一区二区 | 欧美一区二区三区在线看 | 国产精品二区三区在线观看 |