看紅帽如何在RHEL與OpenShift中玩轉(zhuǎn)生成式AI
市場(chǎng)上有很多生成式AI平臺(tái)的選擇,為什么要選擇紅帽?
紅帽總裁兼CEO Matt Hicks直言紅帽的不同之處在于運(yùn)行位置的核心靈活性。企業(yè)既可以對(duì)小型開(kāi)源模型進(jìn)行混合部署,也可以在公有云或自有數(shù)據(jù)中心訓(xùn)練模型,同時(shí)支持主要的GPU供應(yīng)商。
最近在Red Hat Summit上,紅帽發(fā)布了一系列與人工智能相關(guān)的內(nèi)容,包括Linux AI(RHEL AI)和OpenShift AI的最新進(jìn)展。
Matt Hicks表示,RHEL用于運(yùn)行所有可以在Linux上運(yùn)行的應(yīng)用程序,RHEL AI則用于運(yùn)行你可以通過(guò)訓(xùn)練和定制的大型語(yǔ)言模型的AI部分。OpenShift用于管理可以在RHEL上以分布式方式跨集群運(yùn)行的所有應(yīng)用程序,OpenShift AI則以相同的方式管理一系列模型,高效地分割訓(xùn)練、使用和提供服務(wù)。
紅帽總裁兼CEO Matt Hicks
Linux AI(RHEL AI)開(kāi)源AI的創(chuàng)新
RHEL AI是一個(gè)基礎(chǔ)模型平臺(tái),能夠使用戶(hù)更加便捷地開(kāi)發(fā)、測(cè)試和部署生成式人工智能(GenAI)模型。該解決方案被封裝成一個(gè)優(yōu)化的、可啟動(dòng)的RHEL鏡像,用于在混合云環(huán)境中部署單個(gè)服務(wù)器,并已集成到OpenShift AI中。
在意識(shí)到IBM研究院開(kāi)發(fā)的大規(guī)模對(duì)話機(jī)器人對(duì)齊(LAB)技術(shù)能顯著提升模型性能后,IBM和紅帽決定推出InstructLab,這是一個(gè)圍繞LAB方法和IBM開(kāi)源Granite模型構(gòu)建的開(kāi)源社區(qū)。InstructLab項(xiàng)目的目標(biāo)是使開(kāi)發(fā)者通過(guò)簡(jiǎn)化LLM的創(chuàng)建、構(gòu)建和貢獻(xiàn)過(guò)程,像參與任何其他開(kāi)源項(xiàng)目一樣,將LLM開(kāi)發(fā)的權(quán)力交到開(kāi)發(fā)者手中。
RHEL AI融合了企業(yè)級(jí)就緒的InstructLab項(xiàng)目和Granite語(yǔ)言與代碼模型,及全球領(lǐng)先的企業(yè)級(jí)Linux平臺(tái),簡(jiǎn)化了混合基礎(chǔ)設(shè)施環(huán)境中的部署。RHEL AI包括:
- 紅帽支持和保障的開(kāi)源許可Granite語(yǔ)言和代碼模型;
- 提供支持并具有生命周期管理的InstructLab分發(fā)版本,這是一種可擴(kuò)展且成本效益高的解決方案,能夠增強(qiáng)大型語(yǔ)言模型(LLM)的功能,并使知識(shí)與技能的貢獻(xiàn)得到更廣泛的用戶(hù)接納;
- 通過(guò)RHEL鏡像方式提供的優(yōu)化可啟動(dòng)模型運(yùn)行實(shí)例,包括Granite模型和InstructLab工具包,及優(yōu)化的Pytorch運(yùn)行時(shí)庫(kù)和針對(duì)AMD Instinct? MI300X、Intel和NVIDIA GPU以及NeMo框架的加速器;
- 紅帽提供的完整企業(yè)支持和生命周期保證,從可信的企業(yè)產(chǎn)品分發(fā)開(kāi)始,提供24小時(shí)全天候生產(chǎn)支持和擴(kuò)展的生命周期支持。
“RHEL AI的主要目標(biāo)是利用硬件加速,進(jìn)行模型的訓(xùn)練和運(yùn)行。”Matt Hicks說(shuō),RHEL AI更專(zhuān)注于為大型語(yǔ)言模型創(chuàng)建業(yè)務(wù)安全、管理生命周期和提供可預(yù)測(cè)性,并使企業(yè)能夠?qū)ζ溥M(jìn)行修改。
OpenShift AI增強(qiáng)預(yù)測(cè)性和生成式AI的靈活性
紅帽O(jiān)penShift AI是基于紅帽O(jiān)penShift構(gòu)建的開(kāi)放式混合人工智能(AI)和機(jī)器學(xué)習(xí)(ML)平臺(tái),幫助企業(yè)在混合云環(huán)境中大規(guī)模創(chuàng)建并交付人工智能支持的應(yīng)用。
紅帽O(jiān)penShift AI引入了新的增強(qiáng)功能,包括獲取最新的AI/ML創(chuàng)新和以人工智能為中心的龐大合作伙伴生態(tài)系統(tǒng)的支持。最新版本紅帽O(jiān)penShift AI 2.9,提供了邊緣模型服務(wù)、增強(qiáng)型模型服務(wù)、采用Ray支持分布式工作負(fù)載、改進(jìn)模型開(kāi)發(fā)、模型監(jiān)控和可視化、新的加速器配置文件。
在Matt Hicks看來(lái),構(gòu)建一個(gè)堅(jiān)實(shí)的混合云基礎(chǔ)對(duì)企業(yè)AI至關(guān)重要。許多企業(yè)嘗試使用規(guī)模較小的模型進(jìn)行微調(diào)和訓(xùn)練,但往往成效不佳。所以他們會(huì)轉(zhuǎn)向“全知模型”——通常在公共云中運(yùn)行的模型,參數(shù)量超過(guò)一萬(wàn)億,這些模型雖然是開(kāi)箱即用,但運(yùn)行和訓(xùn)練成本相當(dāng)之高。
無(wú)論是在筆記本、邊緣還是任何地方,混合云對(duì)云充分發(fā)揮AI的潛力都是關(guān)鍵。企業(yè)必須改進(jìn)這些小型模型,使其更好地適應(yīng)實(shí)際任務(wù),這就需要在特定用例上完成最后一段訓(xùn)練。
Red Hat Summit上紅帽展示了在開(kāi)放混合云中賦能人工智能戰(zhàn)略,支持人工智能工作負(fù)載在數(shù)據(jù)所在的地方運(yùn)行,無(wú)論是在數(shù)據(jù)中心、多個(gè)公有云或邊緣。紅帽的平臺(tái)為這些工作負(fù)載提供跨環(huán)境的一致性,無(wú)論它們?cè)诤翁庍\(yùn)行,都可以順利推進(jìn)企業(yè)的人工智能創(chuàng)新。