Gartner:雖有泡沫,但中國企業仍最關注大模型和生成式AI
數據分析和人工智能現在在全球任何區域都是被談論最多的技術,尤其是去年生成式AI的出現,可以說攪動了整個人工智能市場,重塑了各行各業對于人工智能的認識。
每年Gartner都會發布針對全球市場的人工智能技術成熟度曲線,今年不僅有全球的報告,Gartner還首次發布了2023年中國數據分析和人工智能技術成熟度曲線。
2023年人工智能技術成熟度曲線的變化主要體現在生成式AI上,中國的技術成熟度曲線則囊括了數據分析和人工智能兩個方面。Gartner高級研究總監張桐說,兩個報告的橫向比較上會有所不同,全球的曲線有智能體和多模態的展現,中國的曲線則更聚焦在相對成熟的大模型和相關應用等。
全球和中國在AI領域上的技術成熟度基本一致,差異比較大的技術成熟度主要在知識圖譜,在海外很多企業已經清楚知道知識圖譜的能力,但中國很多企業雖然也意識到了知識圖譜的重要性,但是由于數據基礎和缺乏技術儲備,依然很難創建。
生成式AI還有很多的泡沫
中國數據分析和人工智能技術成熟度曲線的大模型和生成式AI分開討論,主要是因為生成式AI的涵蓋過于廣泛。
在張桐看來,所有生成式AI都是基于基礎模型,像GPT、Stable Diffusion等,但現在我們說的生成式AI更多是在基礎模型上產生的前端應用。
而大模型才是真正讓生成式AI有了今天的發展,讓AI產生變革的基礎,所以中國將大模型單獨作為一個技術放在曲線中,而且大模型的技術還有一定的發展空間。
目前大模型和生成式AI在曲線頂端,就意味著它有很多泡沫。很多企業也已經意識到只有幾家企業可以做基礎模型,更多企業需要做的是將基礎模型通過企業的數據進行精調訓練或者利用和知識庫結合的提示語,在上面形成自己的應用,就像是選擇基于iOS還是安卓開發APP一個道理。
商業閉源大模型在某些領域會有自己的獨特優勢,因為他們有獨有的數據進行訓練,有資本的支持并且有一套更完備的反饋機制。另外就是開源大模型,一些企業將自己的大模型開源可以更快的幫助模型占領市場份額。。目前中國企業由于合規和數據安全問題,更多會選擇開源大模型,或者閉源大模型的本地部署。
未來基礎模型的架構可能還會不斷演進,張桐認為,Transformer是模擬人腦的工作模式,但是人腦的能耗是非常低的,而大模型的能耗相當高。所以在算力和算法上期待有新的突破。
數據分析技術多在萌芽期
在數據編織、數據資產管理、組裝式數據和分析、數據中臺等技術上,中國也有著明顯的關注提升。
數據編織是一種基于元數據的新型數據管理框架,用于獲得靈活快速的的數據服務,涉及數據集成、主動元數據管理、知識圖譜、機器學習。背后核心的主動元數據管理和知識圖譜技術,距離真正的實現可能系還要較長的時間。
數據資產管理則是Gartner認為在曲線中唯一一個兩年之內就可以實現的技術。張桐提到,我們在做這個判斷的時候有很多爭論,因為很多人認為數據資產管理中有很多客戶數據,客戶的數據價值有多少,能不能入表都是問題。從海外看雖然數據入表談了不下十年,但是目前依然沒有實現。然而隨著我國最近出臺的《企業數據資源相關會計處理暫行規定》,顯然我們的進展更快,也佐證了我們判斷的準確性。
我們的快速進展主要依賴于政府的推動,像數字中國、數據20條,數據要素等政策的頒布,希望數據能夠真正產生價值,所以Gartner認為中國相對海外會有更快的發展,大概率能夠更快實現。
而且組裝式數據分析比數據中臺會更符合很多企業的需求,張桐把組裝式AI比作了樂高玩具,不同的業務人員使用的數據不同,使用的分析工具也不同,插拔式的組裝更容易滿足個性化的需求。
數據中臺的建設是希望實現數據的靈活復用,以及快速敏捷的應用業務的需求,但是很多中臺沒有達成這個目標,所以Gartner認為可組裝數據分析平臺可能是未來的趨勢。張桐說,不應拘泥于中臺這個名詞,將多樣的數據分析產品組合在一起實現數據分析的訴求才是不變的趨勢。