人工智能興起,未來人工智能將無處不在
人工智能(AI)已經(jīng)無處不在,給眾多行業(yè)帶來了革命性的變革。
無處不在的人工智能是我們正在迅速進入的一個時代,在這個時代,終端用戶越來越習慣于大規(guī)模的個性化,否則他們將轉(zhuǎn)向商業(yè)競爭對手提供的產(chǎn)品,這些競爭對手可能正在使用人工智能來創(chuàng)建定制服務(wù)和用戶體驗。
第五代英特爾至強可擴展處理器于2023年12月14日發(fā)布,這是在人工智能領(lǐng)域快速發(fā)展的時代宣布的,特別是由于商業(yè)和公眾對生成式人工智能等模型的興趣在公共終端用戶和商業(yè)社區(qū)都積累了許多用戶。
OpenAI的ChatGPT風靡全球,在短短2個月內(nèi)就積累了1億用戶。來自Meta(Instagram)的線程獲得1億用戶的速度更快,然而,這張圖表說明了用戶采用生成式人工智能的速度有多快。
讓我們回顧一下這段歷程,下面列出了一些關(guān)鍵的人工智能類型:
生成式人工智能的興起
目前人工智能領(lǐng)域的許多令人興奮之處都是由生成式人工智能驅(qū)動的,特別是那些與深度強化學習相結(jié)合的模型。這使終端用戶和企業(yè)能夠創(chuàng)建內(nèi)容,也使企業(yè)能夠開發(fā)更好的最先進的虛擬代理,包括聊天機器人。然而,此類模型的計算成本也很高,導致高能耗,因此也產(chǎn)生了有意義的碳足跡。
如果我們能夠找到有效擴展生成式人工智能的方法,那么就會帶來切實的經(jīng)濟效益。例如,將生成式人工智能應用于客戶服務(wù)相關(guān)功能可能會導致生產(chǎn)力提高,范圍為現(xiàn)有功能成本的30%至45%,并且與研發(fā)相關(guān)的生產(chǎn)力可提高總成本的10%至15%。此外,同一份報告還估計,生成式人工智能可能會提高營銷職能的生產(chǎn)力,其價值占總營銷支出的5%至15%。
生成式人工智能可以幫助企業(yè)進行情感分析、文檔分析和摘要以及文本到圖像的創(chuàng)建。下一節(jié)將舉例說明人工智能如何改變不同經(jīng)濟部門。
醫(yī)療保?。?/strong>醫(yī)學成像、遠程監(jiān)控、用于分析電子健康記錄(EHR)的自然語言、新藥物發(fā)現(xiàn)和個性化藥物交付。
教育:私人導師提供定制的教育支持,以滿足學生的個性化需求。
營銷:用于個性化內(nèi)容創(chuàng)建的生成式人工智能,針對那些更有可能對產(chǎn)品或服務(wù)感興趣的人定制內(nèi)容,以及個性化優(yōu)惠和推薦。
交通:自動駕駛車輛導航、車輛健康檢查和監(jiān)控。
建筑:用于設(shè)計和數(shù)字孿生的生成式人工智能。
安全:入侵者檢測、預測分析、人群控制警告。
網(wǎng)絡(luò)安全:惡意軟件威脅檢測和防護。
制造:預測分析,包括計劃外停機檢測、自動缺陷零件分析。
金融服務(wù)與投資:自動化信用分析、股票研究、ESG分類、投資組合構(gòu)建、風險管理、要素投資、保險自動理賠管理、承保風險評估和定價的金融科技解決方案。
客戶關(guān)系管理(CRM)和客戶體驗(CX):用于客戶參與的聊天機器人
能源:用于檢查太陽能電池板和風力渦輪機葉片缺陷的計算機視覺無人機、天氣預報、可再生能源生產(chǎn)預測、能源需求預測、電池存儲優(yōu)化、智能電網(wǎng);
智慧城市:城市交通規(guī)劃、智慧建筑、優(yōu)化能源消耗。
零售:個性化推薦、庫存管理、產(chǎn)品需求預測、供應鏈優(yōu)化。
會計:經(jīng)過微調(diào)的LLM可以閱讀和分析特定的文檔和電子表格,并協(xié)助開發(fā)票文檔。
法律部門:用于研究協(xié)助、案件管理、發(fā)票管理、合同起草的自然語言。
英特爾第5代thGenXeon可擴展處理器實現(xiàn)AI的高效擴展
大量的延遲會破壞客戶體驗(CX),而高計算資源可能只會導致生成式AI模型成本過高而無法大規(guī)模采用。延遲是指客戶端設(shè)備所需的時間以及從服務(wù)器發(fā)回信號所需的時間設(shè)備,通常是數(shù)據(jù)和分析所在的基于云的遠程服務(wù)器。這可能會導致糟糕且令人不滿意的用戶體驗,甚至可能導致客戶端需要響應才能做出關(guān)鍵決策的潛在危險情況。
最新一代的英特爾至強可擴展處理器可以解決這個問題,并幫助企業(yè)和公眾更有效地采用由LLM支持的生成式人工智能模型。
以下是英特爾與第五代至強可擴展處理器和AIEverywhere相關(guān)的示例:
英特爾矩陣擴展(英特爾AMX)第五代可擴展處理器使生成式AI在CPU上更容易訪問,允許用戶在需要訪問加速器之前執(zhí)行更多操作。
憑借每個內(nèi)核中的AI加速功能,第五代英特爾?至強?處理器已準備好處理苛刻的AI工作負載,包括在需要添加離散加速器之前,對多達200億個參數(shù)的模型進行推理和微調(diào)。
SLA(服務(wù)等級協(xié)議)可在200億個參數(shù)下的LLM上實現(xiàn)實時用戶體驗,令牌(生成動態(tài)口令的終端)延遲低于100毫秒。
具體的性能增強包括:與第四代英特爾至強處理器相比,GPT-J的平均第一次令牌加速高達13%,平均第二次令牌加速高達22%。
相對于第三代英特爾處理器,GPT-J的平均第一令牌加速高達2.3倍,平均第二令牌加速高達64%。
第一個令牌延遲加速高達12%。
與第三代Intel至強處理器相比,LLaMA-213B上的第一個令牌延遲加速高達2.1倍,第二個令牌延遲加速高達48%。
實時推薦
第五代英特爾至強可擴展處理器提供快速,個性化的產(chǎn)品或內(nèi)容推薦,不會減慢用戶體驗,基于深度學習的推薦系統(tǒng)考慮實時用戶行為信號和上下文特征,如時間和地點。第五代英特爾?至強?可擴展處理器采用英特爾?高級矩陣擴展(英特爾?AMX),這是一種內(nèi)置加速器,可加速深度學習推理并加速CPU上的小型模型訓練。性能改進包括:
● 與第四代AMDEPYC(霄龍?zhí)幚砥?相比,DLRM(INT8)的批量推理性能提高了2.34倍。
● 與第四代英特爾至強處理器相比,DLRM(模型)的批量推理性能提高了24%。
自然語言處理
更流暢的體驗和更快的響應
通過自然語言處理(NLP)推理的性能飛躍,實現(xiàn)響應速度更快的智能助手、聊天機器人、預測文本、語言翻譯等。
● 與采用FP32的第三代英特爾至強處理器相比,BERT-Large(大規(guī)模語言模型)的實時推理性能提高了9.9倍。
● 與采用FP32的第三代英特爾至強處理器相比,DistilBERT(大型語言模型)的實時推理性能提高了7倍。
隨著英特爾?oneAPI深度神經(jīng)網(wǎng)絡(luò)庫(oneDNN)軟件優(yōu)化已經(jīng)集成到TensorFlow(符號數(shù)學系統(tǒng))和PyTorch(開源的Python機器學習庫)的主流發(fā)行版中,開發(fā)人員可以更輕松地訪問內(nèi)置AI加速的好處。英特爾?軟件開發(fā)工具使開發(fā)人員可以自由地在不同的硬件架構(gòu)和供應商之間遷移代碼,具有相當?shù)男阅?,提高了生產(chǎn)力和未來的準備能力,而不會帶來昂貴和耗時的挑戰(zhàn)。
對于更密集的AI需求,請?zhí)砑訉S玫挠⑻貭?Gaudi?AI加速器來擴展基于CPU的基礎(chǔ)。
● 與第四代處理器相比,最高可達1.19倍(BF16)和1.23倍(INT8);與第三代英特爾?至強?處理器相比,最高可達9.9倍(BF16)和9.2倍(INT8)。
● 與第四代處理器相比,最高可達1.41倍(BF16)和1.35倍(INT8);與第三代英特爾?至強?處理器相比,最高可達7倍(BF16)和2.9倍(INT8)。
借助已集成到TensorFlow和PyTorch主流發(fā)行版中的英特爾?oneAPI深度神經(jīng)網(wǎng)絡(luò)庫(oneDNN)軟件優(yōu)化,開發(fā)人員可以獲得內(nèi)置AI加速的優(yōu)勢。
● 與AMDEPYC9654相比高達2.34倍,與AMDEYPC9754相比高達1.9倍。
● 與第四代處理器相比,最高可達1.24倍(BF16)和1.24倍(INT8);與第三代英特爾?至強?處理器相比,最高可達8.7倍(BF16)和5.5倍(INT8)。
機器學習
第五代英特爾至強可擴展處理器可在CPU上實現(xiàn)高速機器學習。
經(jīng)典機器學習在高性能計算(HPC)和人工智能應用中發(fā)揮著至關(guān)重要的作用,從生命科學到金融再到學術(shù)研究。憑借大內(nèi)存、快速內(nèi)核和英特爾?高級矢量擴展512(英特爾?AVX-512),第五代英特爾?至強?可擴展處理器可提供出色的機器學習訓練和推理性能。
借助英特爾?AI軟件產(chǎn)品組合,開發(fā)人員可以加速端到端機器學習和數(shù)據(jù)科學管道。這些工具包括優(yōu)化的框架、模型存儲庫、用于Scikit-learn的英特爾?擴展和用于機器學習的英特爾?XGBoost優(yōu)化、通過英特爾?Modin分發(fā)的加速數(shù)據(jù)分析、優(yōu)化的核心Python庫以及端到端工作負載的示例。
此外,英特爾聲稱,與NVIDIA相比,第五代至強可擴展處理器為整個AI管道提供了更廣泛的范圍,用戶可以:
從數(shù)據(jù)預處理到推理,使用比NVIDIA gpu更擅長于更廣泛的AI任務(wù)的Intel?Xeon?處理器導航整個AI任務(wù)。
只需幾分鐘即可在CPU上訓練中小型深度學習模型。借助英特爾?高級矩陣擴展(英特爾?AMX),用戶可以獲得內(nèi)置矩陣乘法引擎,該引擎可提供離散加速器性能,而無需增加GPU的硬件和復雜性。
值得注意的是,當今大多數(shù)數(shù)據(jù)中心人工智能推理部署都在指示信任級別的英特爾?至強?處理器上運行。
此外,英特爾還聲稱,憑借大內(nèi)存、快速內(nèi)核和英特爾?高級矢量擴展512(英特爾?AVX-512),英特爾至強處理器可提供比NVIDIAGPU更好的機器學習訓練和推理性能。
此外,預計邊緣,特別是物聯(lián)網(wǎng)將在2024年繼續(xù)增長和規(guī)?;?,因此支持在設(shè)備上進行AI決策的硬件資源將成為關(guān)鍵。不過,值得注意的是,英特爾第5th代Xeon可擴展處理器通過英特爾高級矩陣可將實時圖像分類推理提高高達24%解決方案。
總而言之,第五代英特爾至強可擴展處理器為企業(yè)和終端用戶,提供了充分利用和擴展生成式人工智能和人工智能模型的巨大潛力的潛力,相對于上一代英特爾至強處理器,性能顯著提高。