如何比以往更容易地將NLP功能集成到現(xiàn)有的應(yīng)用程序堆棧中?
譯文譯者 | 李睿
審校 | 重樓
51CTO讀者成長(zhǎng)計(jì)劃社群招募,咨詢小助手(微信號(hào):CTOjishuzhan)
通過(guò)使用預(yù)先訓(xùn)練的模型,開(kāi)發(fā)人員可以使用日常語(yǔ)言進(jìn)行編碼和查詢。本文將介紹如何進(jìn)行操作。
自然語(yǔ)言處理(NLP)已經(jīng)徹底改變了人們與技術(shù)交互的方式。隨著機(jī)器學(xué)習(xí)(ML)和人工智能(AI)的興起,對(duì)于希望創(chuàng)建智能而直觀的應(yīng)用程序的開(kāi)發(fā)人員來(lái)說(shuō),NLP已經(jīng)成為必不可少的工具。然而,將NLP模型合并到應(yīng)用程序堆棧中并不是一件容易的事情。幸運(yùn)的是,采用新的工具使其比以往任何時(shí)候都更容易。這些工具使開(kāi)發(fā)人員能夠輕松地將NLP模型合并到應(yīng)用程序堆棧中。
在以前,開(kāi)發(fā)人員必須從頭開(kāi)始訓(xùn)練NLP模型,這很耗時(shí),而且需要具備專(zhuān)門(mén)的知識(shí)。而OpenAI公司和Hugging Face公司開(kāi)發(fā)的人工智能工具可以使用預(yù)先訓(xùn)練好的模型更容易地構(gòu)建一組強(qiáng)大的機(jī)器學(xué)習(xí)功能,這些模型可以輕松地集成到任何應(yīng)用程序堆棧中。
這些新的開(kāi)發(fā)工具的最大優(yōu)勢(shì)之一是,它們使編碼和復(fù)雜的查詢更容易訪問(wèn),即使對(duì)于那些沒(méi)有高級(jí)編碼專(zhuān)業(yè)知識(shí)的人來(lái)說(shuō)也是如此。通過(guò)使用預(yù)先訓(xùn)練好的模型,開(kāi)發(fā)人員不需要從頭開(kāi)始;他們可以簡(jiǎn)單地使用NLP模型作為起點(diǎn),并對(duì)其進(jìn)行定制以滿足他們的需求。此外,NLP模型通常可以“開(kāi)箱即用”,并在提供場(chǎng)景和響應(yīng)指南的“提示模板”中為模型提供一些指導(dǎo)。這意味著任何人都可以使用簡(jiǎn)單的日常語(yǔ)言進(jìn)行編碼和查詢,即使是困難的事項(xiàng)。
1、機(jī)器學(xué)習(xí)和NLP如何共存
與傳統(tǒng)的基于規(guī)則的人工智能系統(tǒng)不同,機(jī)器學(xué)習(xí)依賴于一個(gè)學(xué)習(xí)框架,允許計(jì)算機(jī)根據(jù)輸入數(shù)據(jù)進(jìn)行自我訓(xùn)練。因此,機(jī)器學(xué)習(xí)可以使用廣泛的模型來(lái)處理數(shù)據(jù),使其能夠理解常見(jiàn)和不常見(jiàn)的查詢。此外,由于機(jī)器學(xué)習(xí)模型可以從經(jīng)驗(yàn)中不斷改進(jìn),它們可以獨(dú)立處理邊緣情況,而不需要人工重新編程。另一方面,NLP是一種利用機(jī)器學(xué)習(xí)算法使機(jī)器能夠理解人類(lèi)交流的技術(shù)。通過(guò)利用大型數(shù)據(jù)集,NLP可以創(chuàng)建理解對(duì)話的語(yǔ)法、語(yǔ)義和場(chǎng)景的工具。
2、NLP集成的好處
將NLP集成到應(yīng)用程序堆棧的主要好處之一是它可以加快業(yè)務(wù)應(yīng)用程序的開(kāi)發(fā)。通過(guò)使用預(yù)訓(xùn)練的模型,開(kāi)發(fā)人員可以節(jié)省訓(xùn)練和測(cè)試的時(shí)間,快速地將NLP功能整合到應(yīng)用程序中,并更快地將它們推向市場(chǎng)。
先從任務(wù)的自動(dòng)化開(kāi)始。NLP可以將原本耗時(shí)且成本高昂的任務(wù)實(shí)現(xiàn)自動(dòng)化。例如,使用NLP可以顯著加快分析大量文本數(shù)據(jù)的過(guò)程。例如,情感分析是一種常見(jiàn)的NLP應(yīng)用程序,允許企業(yè)快速分析客戶評(píng)論、社交媒體帖子和其他形式的用戶生成內(nèi)容,以識(shí)別模式和趨勢(shì)。
NLP加速開(kāi)發(fā)的另一種方式是使開(kāi)發(fā)人員能夠創(chuàng)建更直觀的用戶界面。聊天機(jī)器人和語(yǔ)音助理等自然語(yǔ)言界面在一系列行業(yè)中越來(lái)越受歡迎。這些界面允許用戶使用自然語(yǔ)言與應(yīng)用程序交互,而不是瀏覽復(fù)雜的菜單和用戶界面。通過(guò)將NLP集成到這些界面中,開(kāi)發(fā)人員可以創(chuàng)建更直觀和用戶友好的應(yīng)用程序。
NLP還可以加快內(nèi)容創(chuàng)建的過(guò)程,這是許多企業(yè)中最耗時(shí)的過(guò)程之一,需要大量的人力投入和資源。然而,通過(guò)使用NLP,開(kāi)發(fā)人員可以將內(nèi)容創(chuàng)建的許多方面實(shí)現(xiàn)自動(dòng)化,例如內(nèi)容摘要、實(shí)時(shí)抄寫(xiě)和翻譯,甚至生成新內(nèi)容。例如,新聞媒體可以使用NLP自動(dòng)生成新聞文章的摘要,使他們能夠在更短的時(shí)間內(nèi)報(bào)道更多的故事,或者在他們的社交媒體渠道上發(fā)布摘要。
也許NLP最大的附加價(jià)值之一是它可以幫助加快數(shù)據(jù)分析和決策過(guò)程。使用NLP分析數(shù)據(jù),開(kāi)發(fā)人員可以快速識(shí)別模式和趨勢(shì),并做出實(shí)時(shí)數(shù)據(jù)驅(qū)動(dòng)的決策。例如在金融行業(yè),NLP可用于分析市場(chǎng)趨勢(shì)和預(yù)測(cè)股票價(jià)格,使交易者能夠?qū)崟r(shí)做出明智的投資決策。
3、將NLP整合到現(xiàn)有的技術(shù)堆棧中
使用OpenAI、Hugging Face、Spacy或NLTK等公司推出的新機(jī)器學(xué)習(xí)工具和框架,如今將NLP集成到現(xiàn)有的技術(shù)堆棧中比以往任何時(shí)候都更容易。重要的是要選擇一個(gè)有良好記錄的工具和活躍的開(kāi)發(fā)人員社區(qū)來(lái)分享知識(shí)和解決問(wèn)題。
一旦選擇了這樣的工具,就可以繼續(xù)進(jìn)行數(shù)據(jù)預(yù)處理,包括清理、標(biāo)記和提取文本數(shù)據(jù),以使其標(biāo)準(zhǔn)化,并可被NLP算法讀取。例如,“詞干”是一種將單詞簡(jiǎn)化為詞根形式的技術(shù)——與其使用單詞“running”、“ran”和“runner”,不如單獨(dú)使用其詞根“run”。這些技術(shù)可以幫助減少詞匯量,提高NLP模型的準(zhǔn)確性。
接下來(lái)就是為給定的用例選擇正確的NLP模型。例如,如果一家企業(yè)正在進(jìn)行情感分析項(xiàng)目,它可能會(huì)使用預(yù)先訓(xùn)練好的模型,例如BERT、GPT-2或ULMFiT,這些模型已經(jīng)在大量對(duì)話數(shù)據(jù)上進(jìn)行了訓(xùn)練。
將NLP集成到應(yīng)用程序堆棧中的好處怎么強(qiáng)調(diào)都不為過(guò),它是創(chuàng)建智能、直觀應(yīng)用程序的關(guān)鍵。由于采用新的工具,將NLP功能整合到現(xiàn)有的技術(shù)堆棧中比以往任何時(shí)候都更容易。然而,在這個(gè)過(guò)程中仍然需要做出一些重要的決定,例如使用哪些工具和框架,以及哪些NLP模型最適合實(shí)現(xiàn)企業(yè)的總體目標(biāo)。許多NLP模型都可以“開(kāi)箱即用”地使用,但是為了利用NLP技術(shù)的民主化,企業(yè)需要通過(guò)確保他們的數(shù)據(jù)準(zhǔn)備就緒,并部署正確的開(kāi)發(fā)人員工具來(lái)奠定基礎(chǔ)。
原文鏈接:https://dzone.com/articles/how-incorporating-nlp-capabilities-into-an-existin