企業AI如何落地?紅帽建議“三步走”
原創“紅帽秉持開源精神,100%的開源。”
近日,在紅帽“以開源的方法將AI帶入企業”媒體溝通會上,面對“未來AI是開源還是閉源?”這一問題,紅帽全球副總裁兼大中華區總裁曹衡康斬釘截鐵地給出了紅帽的選擇。
作為開源技術的積極倡導者,紅帽堅信開源模式是促進技術創新和普及的有效途徑。在人工智能領域,紅帽一如秉承這一理念,通過開源的協作模式,協助企業以更高效、更創新的方式利用AI技術,充分釋放其業務潛力,實現價值的最大化。
AI是開源,也是混合
在媒體溝通會之前,紅帽也對參會媒體發起了小調查,面對“現在AI領域有‘開源派’和‘閉源派,您’挺‘哪一派?”這一問題,50%的媒體朋友選擇了“開源派”,結果與當日媒體溝通會的主題不謀而合。
其實,開源派與閉源派之爭由來已久,體現的是不同的開發哲學。兩者各有利弊,實踐中往往需要找到平衡點。
在紅帽看來,開源AI的核心優勢在于其對技術創新和社區協作的促進作用。開源模式打破了傳統閉源軟件的限制,使得全球的開發者、研究者和企業能夠共同參與到AI技術的開發和完善中。這種開放的環境不僅加速了AI技術的發展,還促進了新想法和解決方案的快速迭代。正如曹衡康所指出的,開源AI能夠快速響應安全問題,因為整個社區都會參與到問題的發現和解決中,這種集體智慧是閉源模式難以比擬的。
此外,紅帽還認為在“多云”環境實現AI的落地。曹衡康先生強調,AI的部署不應當局限于單一的云平臺,而應當跨越公有云、私有云以及邊緣計算設備,形成一個多維度的計算網絡。這種混合云策略賦予了企業更大的自主性和選擇性,使它們能夠根據業務需求、成本效益和安全標準來定制AI解決方案。
在混合云架構下,AI應用可以更接近數據源進行部署,減少了數據傳輸的延遲和成本,提高了處理速度和效率。同時,企業也能夠更好地控制數據的存儲和訪問,滿足了數據隱私和安全的要求。混合云還支持了AI應用的可擴展性。隨著業務需求的增長,企業可以輕松地在云端擴展AI應用的計算資源,而無需擔心基礎設施的瓶頸。這種彈性伸縮能力確保了AI應用能夠靈活應對不同的工作負載,保持高性能和穩定性。
曹衡康強調,AI并非僅僅關于模型,而是一個涉及基礎架構、應用層和模型的綜合體系。因此,紅帽的AI解決方案旨在提供一個全面的、開源的、混合的環境,以支持企業在各個層面上的AI需求。
AI落地,看見冰山下的問題
“很多企業在談到AI實施時跟我說的第一件事情就是,你們紅帽能幫忙買到GPU卡嗎?”紅帽大中華區解決方案架構部高級總監王慧慧笑稱,許多企業在構建AI基礎設施時面臨GPU卡獲取難題。
企業需要GPU卡來訓練模型,而缺乏這些硬件會嚴重阻礙AI項目的發展。王慧慧介紹,紅帽不能幫助企業購買GPU卡,但是紅帽通過云服務,將智算中心的算力“池化”提供共享的算力資源,并以公有云或混合云的形式,使企業能夠按需訪問這些資源,克服AI基礎架構建設的障礙,避免了企業自行建立成本高昂的小型計算中心。
當然,實施AI遠不止買GPU或者選擇模型那么簡單,冰山之下暗藏諸多問題。企業需要評估AI應用場景,并運用AI專業知識來為特定場景選擇適當的模型并且還必須處理AI實施過程中的各項顯著難題,加上AI學科高門檻和人才的稀缺性,使得情況更為復雜。紅帽總結了企業在實施AI創新時的六大挑戰:
- 安全性與合規性(Security & Compliance):企業在AI應用中需要處理數據泄露風險和數據隱私侵犯問題,同時要滿足行業和政府的高監管要求,避免違反數據主權風險。
- 成本(Cost):AI實施中的成本問題,尤其是GPU硬件昂貴且難以購置,增加了企業實施AI的財務負擔。
- 復雜性(Complexity):AI模型的訓練與調優過程復雜,導致回報率低和周期長,時間成本高。此外,工具和框架的選擇多樣,架構復雜,業務目標實現困難。
- 投資回報(ROI):從AI項目中獲得的回報可能不如預期,存在回報周期長和時間成本高的問題。
- 協作(Collaboration):企業在使用AI模型為企業應用賦能時,可能面臨協作效率低下的問題,包括數據科學和AI人才的稀缺,以及缺乏知識技能導致的學習曲線陡峭。
- 人才(Talent):數據科學家難以招聘,企業數據訓練和模型調優的協作效率低,組織AI技術更新可能落后于技術趨勢。
“三步走”,構建企業AI應用
為了幫助企業更好地構建和部署AI應用,紅帽提出了“三步走”策略,為企業提供了一套清晰、高效的解決方案。
首先,在項目初期,企業利用紅帽的InstructLab工具在桌面環境中進行小數據集的初步模型訓練。這一步驟旨在快速驗證AI模型的概念和功能,同時降低資源消耗。InstructLab的易用性和靈活性使AI模型的初步開發變得更為便捷高效。
當模型通過初步測試后,企業進入第二步,即生產級模型訓練階段。王慧慧介紹,紅帽的RHEL AI平臺能提供了一個穩定、安全的環境,支持利用合成數據生成技術擴充數據集,并采用“教師-學生”模型訓練方法提升模型性能。通過基礎模型(教師)指導新模型(學生),實現模型的快速迭代和優化。RHEL AI還提供了模型調優所需的工具和平臺,幫助企業解決數據、工具和模型短缺的問題。
最后,在模型經過生產級訓練并驗證其有效性后,企業需將其部署到大規模分布式集群中,以實現更廣泛的應用和更高的性能。紅帽的OpenShift AI平臺在此階段發揮了重要作用。作為一個強大的AI平臺級產品,OpenShift AI不僅支持MLOps實踐,包括模型的創建、調整、對齊和服務監控,還能在混合云環境中高效部署AI應用。該平臺能夠管理和調度多種異構GPU資源,如NVIDIA、AMD、英特爾等,確保模型的高效運行。此外,OpenShift AI還提供了完整的DevOps平臺功能,支持AI應用的開發、測試、部署和運行。
紅帽的“三步走”策略為企業提供了一套完整的AI應用構建和部署流程,并通過其產品如InstructLab、RHEL AI和OpenShift AI,提供了強大的技術支持和平臺服務。這一策略不僅簡化了AI應用的開發和部署過程,還幫助企業克服了AI實施過程中的技術和資源挑戰,加速了企業數字化轉型的步伐。
生態共建,以開源反哺開源
開源社區一直被視為AI技術創新的重要引擎。紅帽公司深諳此道,推出了如OpenShift AI和InstructLab等一系列前沿的開源工具。當企業選擇參與并貢獻于這一生態時,它們不僅為開源社區注入了寶貴的資源和活力,同時也在這一過程中深化了對AI領域的理解,增強了自身的競爭實力。通過開源貢獻,企業能夠跨越地域的界限,與全球的開發者攜手合作,共同解決難題,推動AI技術的邊界不斷拓寬。
持續的創新和優化始終是開源生態的核心動力。隨著越來越多的企業和開發者加入這一大家庭,AI技術得以不斷演進和完善。紅帽的開源工具和平臺正是這一持續創新的堅實基石,它們幫助企業緊跟技術潮流,保持行業領先地位,實現業務目標與技術創新的和諧共進。通過共同建設開源生態,紅帽攜手全球的開發者和企業,共同塑造AI技術的未來。