成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

徹底改變NLP的三家人工智能初創公司

人工智能
在本文中,我們將介紹三家不同的初創公司,它們的范圍從提供AI驅動的解決方案到提供構建您自己的自定義NLP解決方案的構建塊。

深度學習在自然語言處理方面取得了驚人的進步。利用Explosion、Huggingface和JohnSnowLabs的最新創新。

自然語言處理(NLP)一直是計算機科學家的一個長期夢想,其歷史可以追溯到ELIZA時代,甚至可以追溯到計算本身的基本基礎(圖靈測試,有人嗎?)。NLP在過去幾年經歷了一場戲劇性的革命,過去的統計方法讓位于基于深度學習或神經網絡的方法。

[[439050]]

將深度學習應用于NLP已經產生了大量的、復雜的、通用的語言模型,比如GPT-3,能夠生成與人類寫作真正無法區分的文本。例如,GPT-3解鎖了微軟新的“無代碼”PowerApps平臺中的功能,您可以在其中輸入查詢的自然語言描述,后端將生成代碼(PowerFx表達式基于Excel語法)。

NLP在整個企業中具有巨大的潛力,不僅僅是像谷歌或微軟這樣的巨頭將產品帶到桌面上。在本文中,我們將介紹三家不同的初創公司,它們的范圍從提供AI驅動的解決方案到提供構建您自己的自定義NLP解決方案的構建塊。

Explosion

大多數在NLP圈子工作的開發人員都接觸過Python流行的NLP庫spaCy,但很少有人聽說過Explosion,這家由Matthew Hannibal和Ines Montani創立的公司開發了spaCy和商業注釋工具Prodigy。

作為多年來首屈一指的NLP工具包之一,spaCy能夠毫不費力地處理大量生產工作負載,這是其與其他同類庫的顯著特征之一。如果您有一段時間沒有使用spaCy,您可能會驚訝地發現它跟上現代NLP技術的前沿,其管道基于預訓練的Transformer模型(如BERT),能夠集成自定義來自PyTorch或TensorFlow的模型,并支持50多種開箱即用的語言。

雖然spaCy是開源的,但Explosion還提供了一個付費產品Prodigy,它旨在成為數據科學家工具包中非常寶貴的一部分,能夠對數據集進行富有表現力的、可編寫腳本的注釋,不僅與spaCy有緊密的交互循環,而且還具有全面的支持注釋圖像、音頻和視頻。Prodigy提供了用于構建用于分類、轉錄、邊界框等的管道的方法。這些應該允許數據科學家在數據集的高效注釋方面發揮更積極的作用,從而降低構建豐富輸入數據和創建更好模型的成本。

Huggingface

從提供基于Transformer的NLP模型和Write With Transformer網站的PyTorch庫的公司,到如今的Huggingface無所不能的NLP巨頭,這是一段相當長的旅程。如今,Huggingface的Transformers庫不僅是文本處理的事實上的標準,而且從找到新論文或技術到將其放入庫之間的周轉時間通常以天而不是周來衡量。

Huggingface模型動物園已經擴展到各種不同模型(包括領域、語言、大小等主題)的模型中心,包括一個托管推理API,該API擁有許多模型的加速實現,以及一個易于使用的API用于處理大量不同的數據集。你會發現Huggingface被數千家公司使用,從Grammarly之類的應用程序到微軟、谷歌和Facebook的研究用途。最重要的是,Huggingface為機器學習生態系統貢獻了其他較小的庫,例如最近的Accelerate庫,它消除了在一組分布式機器上訓練大型模型的大部分麻煩。

Huggingface也沒有放慢腳步。最近幾個月,我們已經看到音頻和圖像模型被添加到平臺中,隨著Transformer架構繼續在深度學習領域占據一席之地,征服所有道路,Huggingface很可能會站在最前沿。

JohnSnowLabs

JohnSnowLabs是SparkNLP的管理者,SparkNLP是一個開源NLP框架,它運行在ApacheSpark之上也許并不奇怪。在企業中非常受歡迎,您會發現它為公司中的各種NLP管道提供支持,用于命名實體識別(NER)、信息檢索、分類和情感分析等應用程序。與spaCy一樣,它已經演變為適應NLP中的新范式,標準配備了大量深度學習模型(超過700個!)和400多個用于各種不同應用程序的管道。它還利用ApacheSpark的可擴展性,比許多競爭對手更容易進行分布式部署。

有趣的一件事是,JohnSnowLabs在SparkNLP的基礎上構建了三種付費產品,其中兩種主要針對醫療保健行業,另一種也主要針對該領域,但可以用于其他領域。他們提供HealthcareAI,一個運行在Kubernetes之上的托管平臺,用于醫療保健分析和研究,以及一組用于SparkNLP的附加包,允許使用諸如臨床實體識別和鏈接、提取醫學概念和去識別文本等方法.

另一個付費產品是SparkOCR,它聲稱是同類中最好的OCR解決方案。它以DICOM格式和PDF捕獲區域和輸出的能力對醫療保健領域略有偏見,但具有一套更通用的圖像處理、去噪、去歪斜管道,當然可以與SparkNLP集成以輕松生成可擴展的管道,可以從任何給定的輸入圖像中進行端到端的NER提取。

SparkNLP中有很多嵌入的知識,在醫療保健領域,JohnSnowLabs似乎比其他大型NLP庫提供商更具優勢!

NLP的下一步是什么

未來幾個月人們可能會在NLP領域看到什么?我想還有更多相同的地方,但更大;萬億參數模型現在在谷歌、微軟和Facebook等公司變得越來越重要。雖然GPT-3目前被鎖定在OpenAI的API后面,但預計GPT-NeoX的開源“再創造”將在今年某個時候發布1750億參數模型,將GPT-3生成能力的力量帶到漂亮的這個星球上的任何人。

最后,我們可以期待研究人員在規模的另一端繼續努力,試圖讓這些架構在更小的設備和更長的文檔上運行得更快、更高效。而且您可以放心,所有這些研究的結果也將出現在Explosion、Huggingface和JohnSnowLabs的產品中。

 

責任編輯:趙寧寧 來源: 360機房
相關推薦

2021-05-25 05:45:06

人工智能硬件新創公司AI

2021-09-06 10:13:56

人工智能深度學習技術

2018-05-03 15:09:22

人工智能機器學習深度學習

2019-12-05 12:46:47

人工智能機器學習初創公司

2024-10-21 12:53:23

2023-12-29 10:49:49

2023-05-09 17:31:01

2020-12-23 11:14:49

人工智能銷售行業AI

2018-12-09 16:42:27

人工智能機器學習初創公司

2021-04-25 14:32:04

人工智能AI深度學習

2023-12-19 16:55:18

人工智能科學研究

2020-01-02 10:04:01

人工智能AI

2020-01-03 08:00:00

人工智能AI

2020-03-05 15:32:58

人工智能機器人交通

2021-05-17 14:11:10

人工智能零售技術

2023-10-13 14:54:21

人工智能AI

2022-09-09 11:29:27

人工智能醫療保健

2024-03-15 10:49:22

人工智能自動化硬件設計

2023-10-18 10:25:51

2024-03-01 10:48:24

人工智能物流運營AI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久99精品久久久久久国产越南 | 国产精品国产三级国产aⅴ无密码 | 成人免费视频 | 91久久久精品国产一区二区蜜臀 | 国产精品久久欧美久久一区 | .国产精品成人自产拍在线观看6 | 91久久精品国产91久久 | 69福利影院| aaa级片| 国产久| 天天干天天干 | 亚洲啊v在线 | 精品一区二区三区免费毛片 | 国产精品美女久久久久久久久久久 | 黄色av网站在线观看 | 中文字幕精品一区二区三区精品 | 日韩欧美在 | 日日夜夜精品免费视频 | 天天干狠狠操 | 亚洲xxxxx| 女人毛片a毛片久久人人 | 国产乱人伦 | 一区二区三区视频免费看 | 不卡一区二区三区四区 | 成人午夜在线 | 成人精品一区 | 国产偷自视频区视频 | 国产亚洲精品精品国产亚洲综合 | 久久99久久99 | 在线 丝袜 欧美 日韩 制服 | 国产精品区一区二区三区 | 在线电影日韩 | 国产精品久久久久久久久久久久冷 | 黑人巨大精品欧美黑白配亚洲 | 中文字幕一区二区三区四区不卡 | 免费看国产精品视频 | 精品久久一区 | 日日夜夜天天 | 欧美一区二区三区四区五区无卡码 | 视频第一区 | 四虎影院免费在线播放 |