成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Falcon LLM:開源LLM領域的新王者

譯文
開源
Falcon LLM是一種新的大語言模型,它從LLaMA手中奪走了桂冠。

譯者 | 布加迪

審校 | 重樓

都有新的大語言模型(LLM)出現,越來越多的聊天機器人供我們使用。然而,很難找出哪一個LLM是最好的、每一個LLM方面的進展以及哪一個LLM最有用。

HuggingFace有一個開放的LLM排行榜,負責跟蹤、評估和排名新發布的LLM。它使用一個獨特的框架來測試生成式語言模型處理不同評估任務的表現

之前,LLaMA大語言模型Meta人工智能在排行榜上名列前茅,最近被一個新的預訓練LLM:Falcon 40B所取代。

關于科技創新研

Falcon LLM科技創新研究所TII創立和開發,該公司隸屬阿布扎比政府先進技術研究委員會。政府監督整個阿技術研究,該研究所的科學家、研究人員和工程師團隊專注于提供變革性技術和科學發現。

Falcon 40B簡介

Falcon-40B是一個具有400億個參數的基礎LLM,在一萬億token上進行訓練。Falcon 40B是一種自回歸解碼器模型。自回歸解碼器模型意味著該模型經過訓練,可以在給定前一個token的序列中預測下一個token。GPT模型就是一種典型的自回歸解碼器模型。

結果證明,Falcon的架構在訓練計算預算僅為GPT-3 75%的情況下上明顯優于GPT-3而且只在推理時需要計算。

大規模的數據質量是科技創新研究所團隊關注的一個重要方向,因為我們知道LLM訓練數據的質量非常敏感。該團隊建立了一數據管道,可以擴展到數萬個CPU,以進行快速處理,并能夠使用廣泛的過濾和重復數據刪除從網提取高質量的內容。

科技創新研究所還有另一個簡化:Falcon-7B,它有70億個參數,在15000億token上訓練。如果你在尋找一個隨時可用的聊天模型,可以使用Falcon-40B-Instruct和Falcon-7B-Instruct。

Falcon 40B能做什么?

其他LLM相似,Falcon 40B可以:

  • 生成創意內容
  • 解決復雜問題
  • 客戶服務運作
  • 提供虛擬助手
  • 提供語言翻譯
  • 提供情緒分析
  • 減少和自動化“重復性”工
  • 幫助阿聯酋公司提高效率

Falcon 40B是如何訓練的?

在兩個多月的時間里,它在1萬億個token上進行訓練,AWS上使用384個GPU,并在RefinedWeb的10000億token上進行訓練。其中,RefinedWeb是一個由TII構建的大型英語網絡數據集。

訓練數據由來自網的公共數據集合組成,使用CommonCrawl。該團隊經歷了一個徹底的過濾階段,刪除了機器生成的文本成人內容,并進行了重復數據刪除,以生成一個擁有近5萬億個token的預訓練數據集。

RefinedWeb數據集建立在CommonCrawl之上,顯示模型比在精選數據集上進行訓練的模型具有更好的性能。RefinedWeb也是多模友好的。

Falcon LLM開源

他們已向公眾開放了Falcon LLM的源代碼,使Falcon 40B和7B更容易被研究人員和開發人員使用,它是基于Apache許可證2.0版本發布的。

該LLM曾經只用于研究和商業用途,現在已經開源,以滿足全球全面獲取AI的需求。由于阿聯酋致力于改變AI領域的挑戰和極限因此它沒有商業使用限制方面的版稅。

Apache 2.0旨在AI領域促進一個協作、創新和共享知識的生態系統,確保了開源軟件的安全性

如何使用Falcon- 7B Instruct LLM?

如果您想試簡化版的Falcon-40B,它更適合聊天機器人風格的通用指令,不妨先使用Falcon-7B。

讓我們開始吧。

如果還沒有安裝,請安裝以下軟件包

!pip install transformers
!pip install einops
!pip install accelerate
!pip install xformers

安裝了這些軟件包,就可以繼續運行為Falcon 7B Instruct提供的代碼

from transformers import AutoTokenizer, AutoModelForCausalLM
import transformers
import torch

model = "tiiuae/falcon-7b-instruct"

tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline(
  "text-generation",
 model=model,
 tokenizer=tokenizer,
 torch_dtype=torch.bfloat16,
 trust_remote_code=True,
 device_map="auto",
)
sequences = pipeline(
 "Girafatron is obsessed with giraffes, the most glorious animal on the face of this Earth. Giraftron believes all other animals are irrelevant when compared to the glorious majesty of the giraffe.\nDaniel: Hello, Girafatron!\nGirafatron:",
 max_length=200,
 do_sample=True,
 top_k=10,
 num_return_sequences=1,
 eos_token_id=tokenizer.eos_token_id,
)
for seq in sequences:
  print(f"Result: {seq['generated_text']}")

結語

作為目前最好的開源模型,Falcon摘得了LLaMA的桂冠,人們驚嘆于強大的優化架構、采用獨特許可證的開源以及40B和7B參數這兩種規格。

原文標題:Falcon LLM: The New King of Open-Source LLMs,作者:Nisha Arya

責任編輯:華軒 來源: 51CTO
相關推薦

2023-10-08 09:00:00

LLMGitHub人工智能

2023-06-19 16:05:22

大型語言模型人工智能

2024-11-27 16:17:00

2025-06-05 11:51:14

NVIDIAProRLLLM

2024-11-22 15:59:00

2023-09-27 08:18:03

2023-06-26 07:42:39

2024-05-06 12:52:30

2023-12-27 08:00:00

SQL數據庫LMQL

2023-09-01 15:22:49

人工智能數據

2023-06-09 13:37:00

排行模型

2023-04-10 16:15:16

模型開源

2024-04-11 08:53:57

大型語言模型BERT人工智能

2023-10-06 20:30:33

大模型LLMtoken

2024-03-13 08:03:44

LLM人工智能技術

2025-02-12 10:05:00

AILLM訓練

2024-06-03 07:57:32

LLMLlama 2token

2025-06-06 07:00:00

2024-07-29 09:46:00

2024-05-06 08:44:25

FrugalGPT大型語言模型LLM
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 操亚洲| 欧美成人精品在线观看 | 伊人伊人伊人 | 一区二区三区 在线 | 色爱区综合 | 精品一区二区三区在线观看国产 | 亚洲精品成人网 | 国产精品高潮呻吟久久av野狼 | 狠狠干美女 | 亚洲欧美视频在线观看 | 夜夜爽99久久国产综合精品女不卡 | 日韩一级电影免费观看 | 欧美视频三区 | 国产精品久久久久国产a级 欧美日本韩国一区二区 | 伊人国产精品 | 亚洲福利av| 少妇久久久 | 久久中文字幕视频 | 91精品国产自产在线老师啪 | 91欧美精品成人综合在线观看 | 欧美一区二区在线播放 | 尤物视频在线免费观看 | 日韩一区二区久久 | 欧美精品一区三区 | 一区二区视屏 | 国产成人综合一区二区三区 | 日韩一区在线播放 | 日韩精品一区二区三区中文字幕 | 亚洲乱码国产乱码精品精的特点 | 亚洲欧洲中文 | 国产精品久久久久久久久久久久 | 国产精品美女久久久久久久久久久 | 中文字幕av免费 | 久久久国产一区二区三区 | 欧美日韩综合一区 | 天天综合操 | 国产免费又色又爽又黄在线观看 | 久久综合久久综合久久综合 | 久久久久久91香蕉国产 | 亚洲高清成人在线 | 日韩av美女电影 |