為什么說對象存儲是克服人工智能最大挑戰(zhàn)的理想選擇
2020年發(fā)生的冠狀病毒疫情強調了快速分析和解釋數(shù)據(jù)的重要性,以及人工智能和機器學習在明智決策中發(fā)揮的重要作用。在醫(yī)療研究機構研發(fā)疫苗的過程中,人們見證了機器學習可以用來拯救生命的實際應用,這推動了所需的數(shù)據(jù)訓練以及對人工智能用于實時推理模型的持續(xù)微調。
因為經(jīng)過更好訓練的模型可以產生更快、更精確的人工智能系統(tǒng),所以人工智能面臨的最大挑戰(zhàn)是正確訓練其機器學習模型。
訓練有素的機器學習模型必須穩(wěn)定地攝取大量數(shù)據(jù),這樣才能適應和改進。隨著訓練數(shù)據(jù)集的增長,學習算法的性能會越來越好、變得越來越準確。總而言之,數(shù)據(jù)越多,結果越好。顯然,獲得海量數(shù)據(jù)需要大量存儲空間,但是在這種情況下,并不是所有存儲解決方案都是一樣的。當組織評估如何更好地采用人工智能/機器學習應用程序時,必須在這一過程中不要忽略存儲基礎設施。
組織能否成功地從模型訓練所需的龐大且不斷增長的數(shù)據(jù)集中篩選出可行的見解,并從中收集可行的見解,這取決于其存儲架構能否滿足數(shù)據(jù)管道各個階段的極端苛刻要求。
對象存儲是支持有效機器學習模型必不可少的7個原因
坦率地說,對象存儲是唯一可以幫助解決人工智能/機器學習的模型訓練難題合適的解決方案,以下是為什么對象存儲是最合適的原因:
1. 無限的可擴展性
大量的數(shù)據(jù)需要大量的存儲,而人工智能/機器學習工作負載需要一種可以隨數(shù)據(jù)增長而無限擴展的解決方案。傳統(tǒng)文件和塊存儲解決方案將在數(shù)百TB后達到可擴展性的上限。對象存儲是唯一可以在單個全局命名空間中無限擴展到數(shù)十PB甚至更多的存儲類型。通過隨時隨地無中斷地部署新節(jié)點,根據(jù)需求能夠進行彈性無縫擴展是一個巨大的優(yōu)勢。
2. 內置的數(shù)據(jù)保護
定期備份數(shù)PB的訓練數(shù)據(jù)集不僅耗費時間,而且并不現(xiàn)實。根據(jù)設計,大多數(shù)對象存儲系統(tǒng)都不需要備份。與其相反,它們存儲的數(shù)據(jù)具有足夠的冗余,因此始終受到保護。由于對象存儲解決方案通常被設計為分布式架構(并行運行的分布式服務器的集合,不需要使用特殊機器來提供或管理特定服務),因此所有職責都是分開的,不需要采用中央“控制”的機器。因此,其架構中的單點故障(SPOF)的風險為零。分布式對象存儲系統(tǒng)具有自我修復功能,可以提供極高的數(shù)據(jù)持久性。系統(tǒng)可以配置為容忍多個節(jié)點甚至分布式數(shù)據(jù)中心發(fā)生的故障。
3. 固有的元數(shù)據(jù)搜索和分類
在構建和訓練有效的機器學習模型所需的數(shù)據(jù)準備階段中,必須有詳細的描述性元數(shù)據(jù),這使得輕松標記、搜索、定位和分析數(shù)據(jù)成為可能。存儲架構會影響收集元數(shù)據(jù)的能力。文件和塊系統(tǒng)不支持應用程序或用戶定義的擴展屬性,但對象存儲系統(tǒng)提供了獨特的方法,可以使用極其豐富、可自定義的元數(shù)據(jù)來標識數(shù)據(jù)。其不受限制的性質使標簽易于標記、具有強大而快速的可搜索性,以及有效管理大型數(shù)據(jù)集。
4. 多租戶功能
通過多租戶隔離工作負載,使多個數(shù)據(jù)科學家團隊可以同時使用同一數(shù)據(jù)源,而不會互相影響或爭奪資源。為服務多租戶用例而設計的對象存儲系統(tǒng)使得從一個可擴展的、與AWS S3兼容的接口中安全地管理租戶數(shù)據(jù)變得更加簡單。
5. 持續(xù)的吞吐量性能可縮短訓練時間
以最佳速率維持數(shù)據(jù)管道的能力對于訓練機器學習模型至關重要。要快速獲得結果,就需要提高基礎設施的效率,否則在龐大的數(shù)據(jù)集上運行的計算將被減慢或中斷。現(xiàn)代的對象存儲系統(tǒng)可保持高數(shù)據(jù)吞吐量,此外,還可進行橫向擴展以獨立和線性地提高整體系統(tǒng)容量和性能。這可以通過以存儲服務器的形式添加系統(tǒng)資源來實現(xiàn),這些資源可以提供要由存儲軟件作為單個存儲池進行管理的計算(CPU和內存)和容量(閃存和HDD硬盤)。
6. 人工智能/機器學習算法在云中運行
無論數(shù)據(jù)位于何處,與公共云的集成都非常重要,尤其是當公共云平臺為人工智能/機器學習提供了一些現(xiàn)成的且有吸引力的工具集時。在架構上,對象存儲更適合訓練和調整機器學習模型,因為對象存儲憑借其事實上的語言——AWS S3 API,可以在內部部署/私有云環(huán)境與公共云存儲之間進行無縫訪問和移動。最好的對象存儲解決方案使用戶能夠在一個統(tǒng)一的命名空間中管理基于云計算的數(shù)據(jù)和內部部署數(shù)據(jù),消除了數(shù)據(jù)孤島,并允許資源在不損失任何功能的情況下進行協(xié)作和交換。
7. 較低的總體擁有成本(TCO)
專為人工智能/機器學習工作負載設計的存儲基礎設施不僅必須提供容量和性能,而且還必須提供存儲、移動和管理最佳模型訓練所需的數(shù)PB數(shù)據(jù)的成本效益。通過利用標準服務器技術以及在單個系統(tǒng)中進行大規(guī)模操作的能力,對象存儲可以成批地交付,而成本只有傳統(tǒng)專有企業(yè)存儲成本的一小部分。軟件定義的解決方案可以托管在成本較低的標準x86服務器上,并且可以跨多代硬件發(fā)展以降低成本。
尋求實現(xiàn)其人工智能應用程序全部價值的組織必須了解正確訓練和微調其機器學習模型的關鍵性質和潛在挑戰(zhàn)。明智的組織會在選擇正確的存儲基礎設施方面像在計算需求方面一樣謹慎。而對象存儲解決方案為最終提取快速準確的分析洞察力、挽救生命和其他方面提供了最佳的基礎。