加速AI推理,探索英特爾? 至強? 可擴展處理器在OCR應(yīng)用落地方面的實踐
原創(chuàng)利用AI加速企業(yè)業(yè)務(wù)的自動化進程,推動業(yè)務(wù)流程的數(shù)智化重塑或升級,已經(jīng)成為企業(yè)提升工作效率、助力商業(yè)創(chuàng)新的重要方式。在此過程中,由AI賦能的智能光學(xué)字符識別 (OCR) 應(yīng)用發(fā)揮著日益重要的價值。
隨著人工智能技術(shù)的發(fā)展,由AI賦能的OCR已經(jīng)在金融、政府、制造、互聯(lián)網(wǎng)、醫(yī)療等行業(yè)的單據(jù)識別、信息流入、圖片翻譯、車牌識別等場景得到廣泛應(yīng)用,幫助企業(yè)有效地釋放人力資源,提升工作效率,為廣泛的數(shù)智化應(yīng)用提供基礎(chǔ)能力支撐。
部署智能OCR應(yīng)用能為企業(yè)業(yè)務(wù)及AI應(yīng)用布局帶來哪些回報?
用友算法工程專家宋祺、亞信科技產(chǎn)品運營專家呂瑩、東軟集團醫(yī)療保障事業(yè)部產(chǎn)品發(fā)展部部長黃小衛(wèi)、英特爾人工智能軟件架構(gòu)師桂晟、虎博科技創(chuàng)始人&CEO陳燁,圍繞《從OCR起步推進企業(yè)AI應(yīng)用落地》這一主題進行了精彩的分享。
AI 賦能 OCR,助推企業(yè)增效降本
隨著當前大語言模型的發(fā)展,OCR技術(shù)將會成為大語言模型應(yīng)用的一個重要入口和前置的輸入來源。OCR本身是個很大的市場,其算法和程序需要部署在很多地方,可能是公有云、私有云,或者是邊緣的本地服務(wù)器,甚至是一些終端設(shè)備上。
有非常多的軟件開發(fā)商和算法供應(yīng)商參與其中,廠商們通常需要一個更有成本優(yōu)勢、硬件適配性更廣的解決方案。
總體看來,用戶有如下亟待解決的兩個問題:
一是要解決使用GPU帶來的高成本和難部署問題;二是要提高 CPU 的計算性能。
為此,用友、亞信、東軟選擇與英特爾合作,借助英特爾?? 至強?? 可擴展處理器的強大性能和內(nèi)置AI加速器提升OCR應(yīng)用性能,賦能客戶加速數(shù)智化轉(zhuǎn)型。
優(yōu)化OCR應(yīng)用性能,充分釋放CPU計算潛能
用友算法工程專家宋祺分享了《英特爾AI加速技術(shù)在用友OCR場景的應(yīng)用》。
為了兼顧GPU利用率和調(diào)用峰值服務(wù)的可用性,在月末報銷量大、服務(wù)調(diào)用集中時,用友采用了一套異構(gòu)處理器的服務(wù)架構(gòu),即利用搭載了OpenVINO?? 工具套件的英特爾?? 至強?? 可擴展處理器將高峰期的數(shù)據(jù)分流。僅需增加兩臺16核的CPU服務(wù)器,即可滿足峰值,使峰值時的GPU使用數(shù)量降低了50%。
經(jīng)過OpenVINO?? 工具套件優(yōu)化的算法服務(wù),響應(yīng)時間降低到3秒以內(nèi),使得在切換整個處理架構(gòu)時不會影響整體的業(yè)務(wù)響應(yīng)時間和對應(yīng)的時延,對用戶是無感知的。
亞信科技產(chǎn)品運營專家呂瑩介紹到:亞信科技機器人流程自動化平臺(AISWare AIRPA)是通過模擬并增強人類與計算機的交互過程,實現(xiàn)工作流程自動化的平臺。其在RPA功能的基礎(chǔ)上,提供了強大的智能OCR支持。
在智能OCR應(yīng)用中,亞信科技通過第四代至強?? 可擴展處理器和英特爾?? AMX支持實現(xiàn)從FP32到INT8/BF16的量化,從而在可接受的精度損失下,增加吞吐量并加速推理。
從結(jié)果上來看,相比傳統(tǒng)人工方式,成本降到至1/5到1/9之間,而且效率還提升約5-10倍。
東軟自研的OCR識別算法是基于深度學(xué)習(xí)主流技術(shù)實現(xiàn)的,能夠在復(fù)雜的背景下識別出不同醫(yī)院、不同格式的票據(jù)、處方、發(fā)票、費用清單、明細等票據(jù)信息。在英特爾至強?? 可擴展服務(wù)器和OpenVINO?? 環(huán)境下,它能夠獲得更高的識別準確率和更快的識別速度。
并且東軟在方案設(shè)計的階段就和英特爾合作,采用不同代際的至強?? 可擴展處理器的服務(wù)器來進行整體算法性能的驗證。最終實驗結(jié)果表明,在第四代英特爾?? 至強?? 可擴展處理器上采用OpenVINO?? 進行模型推理加速將大幅提升OCR的識別性能。
這些OCR應(yīng)用的成功應(yīng)用,都少不了英特爾軟硬件產(chǎn)品的加持。
英特爾人工智能軟件架構(gòu)師桂晟表示,隨著英特爾? 至強? 可擴展處理器的演進,單個CPU的核心數(shù)量不斷增加,從第一代的最多28核增長到第四代的最高60核,核心數(shù)量的增多帶來了更加強大的算力。
除此之外,英特還在CPU指令集方面專門為人工智能應(yīng)用進行了很多優(yōu)化,例如英特爾?? AMX。其針對廣泛的硬件和軟件優(yōu)化,通過提供矩陣類型的運算,顯著增加了人工智能應(yīng)用程序的每時鐘指令數(shù) (IPC),在AMX加速引擎的助力下,至強? 可擴展處理器不僅能用來做推理,還能用來處理一些機器學(xué)習(xí)訓(xùn)練的工作負載。
大模型技術(shù)驅(qū)動下,OCR 未來路在何方
大模型技術(shù)會為 OCR 及相關(guān)應(yīng)用帶來哪些新的變革?將如何為各行各業(yè)賦能?在本場研討會的最后,虎博科技創(chuàng)始人&CEO陳燁圍繞《大模型落地應(yīng)用思考,展望OCR及相關(guān)應(yīng)用的新技術(shù)發(fā)展》進行了詳細的分享。
談到智能 OCR,陳燁表示其產(chǎn)品的關(guān)鍵點主要有兩個:一是知識庫建立要準,要真正把文件理解好,把它轉(zhuǎn)化成知識庫和大模型能夠理解的形式;二就是大模型。
而虎博科技的定位就是給大家提供一個基礎(chǔ)模型,使用戶可以基于基礎(chǔ)模型迅速打造出自己領(lǐng)域里的大語言模型和應(yīng)用。
陳燁認為這整個旅程才剛剛開始,虎博科技很期待和大家、生態(tài)伙伴、開發(fā)者、應(yīng)用者一起來見證接下來人工智能NLP大語言模型令人興奮的、繁榮的幾十年。
如果您對本文涉及的基于英特爾?? 至強?? 可擴展處理器對及英特爾?? AMX如何顯著提升OCR推理性能的技術(shù)細節(jié)感興趣,如果您也想了解虎博科技在大模型落地應(yīng)用思考,英特爾《至強實戰(zhàn)課》之《從OCR起步推進企業(yè)AI應(yīng)用落地》將為您帶來更加全面且詳細的真人講解,歡迎大家掃描海報中的二維碼注冊收看;
點擊鏈接也可以了解更多英特爾?? AMX對OCR多場景應(yīng)用的性能提升。