本周六定位上海!解析百度文心(ERNIE)如何助力快速定制企業(yè)級(jí)NLP模型
文心(ERNIE)是依托百度深度學(xué)習(xí)平臺(tái)飛槳打造的語(yǔ)義理解技術(shù)與平臺(tái),集先進(jìn)的預(yù)訓(xùn)練模型、全面的NLP算法集、端到端開(kāi)發(fā)套件和平臺(tái)化服務(wù)于一體,為企業(yè)和開(kāi)發(fā)者提供一整套NLP定制與應(yīng)用能力。在2020世界人工智能大會(huì),百度文心(ERNIE)榮獲最高獎(jiǎng)項(xiàng)SAIL獎(jiǎng)(Super AI Leader,卓越人工智能引領(lǐng)者)。
ERNIE開(kāi)創(chuàng)性地將大數(shù)據(jù)預(yù)訓(xùn)練與多源豐富知識(shí)相結(jié)合,持續(xù)學(xué)習(xí)海量數(shù)據(jù)中的知識(shí),將機(jī)器語(yǔ)義理解水平提升到一個(gè)新的高度。以中文模型為例,目前ERNIE已經(jīng)學(xué)習(xí)了1500萬(wàn)篇百科語(yǔ)料和詞語(yǔ)、實(shí)體知識(shí),700萬(wàn)個(gè)人類(lèi)對(duì)話(huà),3億的文章的因果結(jié)構(gòu)關(guān)系,以及10億次的搜索查詢(xún)與結(jié)果的對(duì)應(yīng)關(guān)系,以及2000萬(wàn)的語(yǔ)言邏輯關(guān)系知識(shí)。模型還在持續(xù)不斷地建模新的海量數(shù)據(jù)與知識(shí),不斷地提升下游的應(yīng)用效果。ERNIE在中英文的16個(gè)任務(wù)上已經(jīng)超越了業(yè)界最好模型,全面適用于各類(lèi)NLP應(yīng)用場(chǎng)景。
目前,EasyDL已預(yù)置了領(lǐng)先的預(yù)訓(xùn)練模型ERNIE2.0,并配套了多種NLP經(jīng)典算法網(wǎng)絡(luò),支持了文本分類(lèi)、短文本匹配和序列標(biāo)注等典型文本處理任務(wù)。
近日,文心(ERNIE)重磅發(fā)布三項(xiàng)功能,新增定制多標(biāo)簽文本分類(lèi)、情感傾向分析、文本實(shí)體抽取模型等功能,同時(shí)數(shù)據(jù)管理能力也進(jìn)一步增強(qiáng),更好地滿(mǎn)足NLP領(lǐng)域開(kāi)發(fā)者需求,開(kāi)發(fā)者可通過(guò)百度AI開(kāi)發(fā)平臺(tái)EasyDL進(jìn)行使用。
EasyDL是百度大腦面向企業(yè)開(kāi)發(fā)者推出的零門(mén)檻AI開(kāi)發(fā)平臺(tái),基于百度自主研發(fā)的深度學(xué)習(xí)平臺(tái)飛槳,結(jié)合業(yè)界先進(jìn)的工程服務(wù)技術(shù)打造,覆蓋視覺(jué)與自然語(yǔ)言處理兩大技術(shù)方向,支持一站式智能標(biāo)注、模型訓(xùn)練、服務(wù)部署等全流程功能。目前EasyDL已經(jīng)被廣泛應(yīng)用在零售、互聯(lián)網(wǎng)、安全生產(chǎn)、工業(yè)質(zhì)檢、教育、醫(yī)療、交通等20多個(gè)行業(yè),擁有70多萬(wàn)用戶(hù)。
使用EasyDL簡(jiǎn)單三步即可完成NLP任務(wù)配置與訓(xùn)練,性能優(yōu)異。
那么,文心這么厲害,有沒(méi)有機(jī)會(huì)和高工面對(duì)面,快速掌握技術(shù)原理與實(shí)際應(yīng)用?
本周六,百度資深研發(fā)工程師空降上海,一個(gè)上午從文心(ERNIE)技術(shù)解析到實(shí)戰(zhàn)演練為你解析如何定制企業(yè)高精度NLP模型。(文末海報(bào)報(bào)名哦)
我們先來(lái)點(diǎn)技術(shù)干貨稍做預(yù)習(xí),了解下文心(ERNIE)近期重磅上線(xiàn)的多項(xiàng)實(shí)用功能!
新增定制化多標(biāo)簽文本分類(lèi)功能
“多標(biāo)簽文本分類(lèi)”指對(duì)一段文本同時(shí)標(biāo)記多個(gè)標(biāo)簽,如:“未來(lái)的學(xué)和教正在發(fā)生顛覆,學(xué)生將會(huì)在家里學(xué)習(xí),機(jī)器人將走上講臺(tái)。”可對(duì)應(yīng)標(biāo)簽為“教育”、“科技”。該功能應(yīng)用場(chǎng)景廣泛,如媒體場(chǎng)景中對(duì)新聞內(nèi)容進(jìn)行自動(dòng)歸類(lèi),在內(nèi)容推薦場(chǎng)景中利用內(nèi)容標(biāo)簽提升召回,通過(guò)自動(dòng)標(biāo)簽功能對(duì)知識(shí)文檔進(jìn)行多層級(jí)分類(lèi)等。
目前,EasyDL平臺(tái)經(jīng)典版和專(zhuān)業(yè)版均新增了這項(xiàng)功能,在“專(zhuān)業(yè)版”的任務(wù)配置過(guò)程中,開(kāi)發(fā)者還可選擇ERNIE Tiny、ERNIE Large、ERNIE Base三種各有所長(zhǎng)的預(yù)訓(xùn)練模型。
新增定制化情感傾向分析功能
“情感傾向分析”指對(duì)一段文本進(jìn)行“積極情感”或“消極情感”的判斷,如“酒店位置很好,服務(wù)周到熱情,下次一定會(huì)再來(lái)”的用戶(hù)評(píng)價(jià),部署模型后可直接得到“Positive(積極情感)”的標(biāo)簽和99%的置信度。
該功能最常應(yīng)用于用戶(hù)評(píng)論分析和輿情分析,比如商品、店鋪的口碑分析,對(duì)事實(shí)性的新聞事件或互聯(lián)網(wǎng)話(huà)題進(jìn)行輿情分析等,在汽車(chē)、餐飲、酒店等多個(gè)垂類(lèi)上,分析準(zhǔn)確率可達(dá)到95%以上。
目前,該功能已經(jīng)上線(xiàn)EasyDL經(jīng)典版,后續(xù)平臺(tái)將逐步增加基于實(shí)體級(jí)和句子級(jí)的情感分類(lèi),力求覆蓋更多的應(yīng)用需求。
文本數(shù)據(jù)管理和數(shù)據(jù)標(biāo)注功能全面升級(jí)
針對(duì)開(kāi)發(fā)者數(shù)據(jù)管理和數(shù)據(jù)標(biāo)注過(guò)程中的痛點(diǎn),EasyDL支持了更加靈活的數(shù)據(jù)格式,當(dāng)前可支持zip、Excel、TXT三種文件格式進(jìn)行上傳。除了提供在線(xiàn)標(biāo)注能力外,還提供智能標(biāo)注功能,大幅降低了開(kāi)發(fā)者的標(biāo)注成本,開(kāi)發(fā)者可直接上傳未標(biāo)注數(shù)據(jù)體驗(yàn)該功能。
圖:文本智能標(biāo)注示意圖
10 月 24 日當(dāng)天,百度 AI 快車(chē)道【飛槳開(kāi)源框架高階營(yíng)】線(xiàn)下課程 “閃現(xiàn)” 上海站,邀請(qǐng) “魔都程序猿” 和 “滬上程序媛” 來(lái)到上海市徐匯區(qū)瑞平路 230 號(hào)保利時(shí)光里 B1-09——LOFAS 集聚空間,與百度資深高工、各位行業(yè)開(kāi)發(fā)者相聚一堂。上海站內(nèi)容絕對(duì)不會(huì)令你 “空腦而歸”,開(kāi)發(fā)全流程、部署工具、高精度目標(biāo)檢測(cè)、模型優(yōu)化方案一一奉上,更有“全能”OCR、金牌推薦算法,一起來(lái)場(chǎng)硬核趴體吧!
想了解強(qiáng)大文心(ERNIE)背后的技術(shù)原理?
想更進(jìn)一步快速掌握NLP模型開(kāi)發(fā)方法與技巧?
想線(xiàn)下和百度資深研發(fā)與各行業(yè)開(kāi)發(fā)者深度溝通?
本周六上午,就在上海徐匯區(qū)復(fù)興路1199號(hào)A座5層,百度AI快車(chē)道【EasyDL零門(mén)檻模型訓(xùn)練營(yíng)】,資深研發(fā)工程師詳解NLP技術(shù)能力,并帶來(lái)現(xiàn)場(chǎng)實(shí)操與面對(duì)面答疑解惑,助你三小時(shí)掌握EasyDL的NLP模型開(kāi)發(fā)秘籍!
點(diǎn)擊下方鏈接即可體驗(yàn)!
https://paddle.wjx.cn/m/93404058.aspx?udsid=798299