成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

PubMedBERT:生物醫學自然語言處理領域的特定預訓練模型

人工智能
今年大語言模型的快速發展導致像BERT這樣的模型都可以稱作“小”模型了。Kaggle LLM比賽LLM Science Exam 的第四名就只用了deberta,這可以說是一個非常好的成績了。

今年大語言模型的快速發展導致像BERT這樣的模型都可以稱作“小”模型了。Kaggle LLM比賽LLM Science Exam 的第四名就只用了deberta,這可以說是一個非常好的成績了。所以說在特定的領域或者需求中,大語言模型并不一定就是最優的解決方案,“小”模型也有一定的用武之地,所以今天我們來介紹PubMedBERT,它使用特定領域語料庫從頭開始預訓練BERT,這是微軟研究院2022年發布在ACM的論文。

論文的主要要點如下:

對于具有大量未標記文本的特定領域,如生物醫學,從頭開始預訓練語言模型比持續預訓練通用領域語言模型效果顯著。提出了生物醫學語言理解與推理基準(BLURB)用于特定領域的預訓練。

PubMedBERT

1、特定領域Pretraining

研究表明,從頭開始的特定領域預訓練大大優于通用語言模型的持續預訓練,從而表明支持混合領域預訓練的主流假設并不總是適用。

2、模型

使用BERT。對于掩碼語言模型(MLM),全詞屏蔽(WWM)強制要求整個詞必須被屏蔽。

3、BLURB數據集

據作者介紹,BLUE[45]是在生物醫學領域創建NLP基準的第一次嘗試。但BLUE的覆蓋范圍有限。針對基于pubmed的生物醫學應用,作者提出了生物醫學語言理解與推理基準(BLURB)。

PubMedBERT使用更大的特定領域語料庫(21GB)。

結果展示

在大多數生物醫學NLP任務中,PubMedBERT始終優于所有其他BERT模型,并且通常具有顯著的優勢。

責任編輯:華軒 來源: DeepHub IMBA
相關推薦

2022-09-30 15:28:05

BERT語言模型自然語言

2017-05-05 15:34:49

自然語言處理

2014-08-21 09:16:45

生物醫學

2021-09-03 12:01:07

模型自然語言

2018-02-27 09:32:13

神經網絡自然語言初探

2024-06-11 07:40:00

2020-04-24 10:53:08

自然語言處理NLP是人工智能

2021-05-13 07:17:13

Snownlp自然語言處理庫

2022-04-22 09:00:00

自然語言處理HMMCRF

2022-04-11 09:30:00

自然語言HMM深度學習

2017-10-19 17:05:58

深度學習自然語言

2024-04-24 11:38:46

語言模型NLP人工智能

2018-04-04 12:00:00

2024-02-05 14:18:07

自然語言處理

2021-06-23 15:45:55

神經網絡AI算法

2020-08-10 15:25:00

人工智能機器學習技術

2021-05-17 09:00:00

自然語言人工智能技術

2017-04-17 15:03:16

Python自然語言處理

2025-05-28 01:50:00

2010-01-27 10:11:44

曙光超算HPC
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 男女那个视频 | 国产精品一区二区免费 | 一区欧美 | 日韩电影a| www.国产| 一级片视频免费观看 | 人人做人人澡人人爽欧美 | 91国内精品久久 | 一级做a爰片性色毛片16 | 亚洲国产一区二区视频 | 不卡一区 | 国产成人jvid在线播放 | 欧美精品久久久久 | 亚洲国产aⅴ成人精品无吗 国产精品永久在线观看 | 欧美亚洲视频在线观看 | 一级做a毛片 | 国产免费一区二区三区 | 久久综合av | 999精彩视频 | 日韩中文字幕在线不卡 | 久久久爽爽爽美女图片 | 男人天堂网址 | 午夜激情网| 国产一区二区三区四区三区四 | 成人激情视频免费在线观看 | 成人一区av偷拍 | 国产1区 | 国产日产久久高清欧美一区 | 国产一级免费在线观看 | 国产精品18hdxxxⅹ在线 | 国产激情视频网址 | av黄色在线观看 | 亚洲免费一区二区 | 91精品在线播放 | 一级片av | 成人免费视频网站在线观看 | 在线伊人网| 亚洲精品成人av久久 | 高清黄色 | 成人免费视频在线观看 | 欧美一区免费 |