從AIGC到AGI,為什么我們需要更多的“技術信仰派”? 原創
整理 | 伊風
采訪 | 張曉楠
嘉賓 | 巴川、朱雷、肖然
出品 | 51CTO技術棧(微信號:blog51cto)
作為AIGC應用落地元年,2024開年就拋給我們一些不太好回答的問題:
- 在以探索AGI為長期目標時,我們該堅守技術信仰嗎?
- 除了復制國外GPT-4、Sora這樣的成功案例,我們該如何尋求更大發展和突破?
- 即便算力問題得以解決,算法的難題如何跨越?
- 國內企業為什么大都部署多個大模型?為什么并非所有企業都該擁抱AIGC?
前不久51CTO全新直播欄目《AIGC實戰派》有幸邀請到競技世界首席數據科學家巴川,元語智能聯合創始人兼COO、SuperCLUE社區發起人朱雷以及Thoughtworks中國區總經理、中關村智聯創新聯盟秘書長肖然,在對談中回答以上疑問。
1.“技術信仰派”還是“市場信仰派”,只是一時之爭
51CTO: 在大模型“技術信仰派”與“市場信仰派”之爭中,你們站哪一派?這背后又折射了怎樣的一種現實?
巴川:我思考過這個問題,但是沒能給出一個非黑即白的答案。就長期而言我傾向于技術信仰派,因為技術進步是推動生產力發展的關鍵因素,雖然現在AIGC被炒得非常熱,但其長期影響力仍然是被低估的。
但在短期內,大模型技術所能產生的影響又被高估了,這種誤判算是技術落地和廣泛應用的一個必經階段。短期內,AIGC將不斷向各行各業泛化,從這點來看,市場信仰派的觀點也很有價值。
朱雷:我是堅定的技術信仰派,就目前看,我認為技術派的勝算更大,因為推動大規模數據訓練和參數量的躍升已經是全球性的技術共識,大家都在“卷”技術、搶人才。
對于市場派的觀點,我認為技術需要服務于用戶和客戶,解決具體的業務問題,這個站位和邏輯也沒有問題。然而,在以探索AGI為長期目標時,國內需要一些堅持技術信仰的團隊,他們以長期研究和技術突破為目標,將商業化應用作為支持研發和基礎架構試錯的一種手段。
國內有幾家大模型公司我是很看好的,因為他們在技術層面有獨到的見解,比如做RAG搜索增強、長文本等等。但他們也沒有只做技術,也在各自的技術路線上嘗試了多種應用,如角色扮演、游戲、效率工具等。我覺得正因為他們有技術信仰,所以會在自己的應用上思考的更長遠一點。
相反,如果僅從商業化的角度出發,忽視技術的成熟度,這種做法從長期看是特別危險的。我們可以看到,隨著AI技術的不斷進步,一些早期的AI應用已經失去了競爭力。OpenAI的Sora一旦對外開放,就將“殺死”很多小的AI視頻剪輯、自動化生成工具。因此,在AGI的早期階段,一定要保持技術前瞻性,去做長期的投入和研究。
肖然:在AI技術浪潮中,真正盈利的往往是提供工具的一方,而非單純追求市場應用的一方。這些工具,如RAG、Raptor等,本質上是技術產品,它們的市場價值在于支持和促進技術創新。
所以,技術的快速發展已經使得所謂的市場化變得不那么重要,因為需求實現的過程已經被極大程度地壓縮了。年輕一代,即使沒有深厚的計算機背景,也能在短時間內學會構建智能應用。這表明,我們正在進入一個新時代,其中技術和市場之間的界限變得模糊。
從當前的角度來看,技術的重要性更為突出。如果你想創造出能夠完成更多任務的智能化產品,這非常依賴于底層基礎模型的發展。只有基礎模型得到提升,我們才能完成更多、更復雜的任務。
2.如果都是“市場派”邏輯,追上國外會變得更難
51CTO : 對比國外,國內大模型會面臨哪些不同?你們對國內大模型市場抱有哪些期待?
巴川:從算力角度來看,我們雖然在迎頭追趕,但仍然存在差距。芯片核心技術在國外手里,這直接影響了我們獲取最先進硬件的能力;另外,顯卡的采購困難和禁售帶來的價格飛漲也對我們產生了直接影響。
在算法方面,雖然很多人認為國內外的算法水平沒有太大差異,但我們使用的基礎框架,如Transformer等,大多還是來自國外。盡管國內的一些公司也在嘗試開發自己的框架,但離落地應用、甚至成為主流框架還差很多。
在數據方面,我認為國內是有獨特優勢的。互聯網快速發展的一二十年里,我們積累了大量數據,特別是在垂直領域,一旦某個應用推廣開來,就能夠迅速覆蓋數億用戶,這是歐美尤其是歐洲難以做到的。這樣的用戶基數使得我們能夠快速積累用戶數據,并在特定垂直領域快速實現應用的落地和迭代。
朱雷:在我看來,國內外在大模型市場上的主要差異體現在發展節奏和目標上。比如OpenAI和谷歌下面的DeepMind,他們的目標更多地集中在實現AGI上。雖然他們也在推進商業化,但視野更為長遠,并在安全和基礎架構上進行了深入研究和探索。
相比之下,目前國內更多地在復制國外的成功案例,如GPT-4和Sora等。不過盡管如此,國內公司融資充足,人才儲備也具備一定水平,且具有全球化視野,這有助于我們在數據規模和質量上進行補充。
我認為,國內的期待在于未來五年內能否在基礎架構上取得突破,而不是僅僅跟隨國外的技術發展。目前,國內正在努力追趕GPT-4的水平,同時也有探索非Transformer架構的嘗試。因為Transformer架構本身存在局限性,預測下一個token,并不是真實世界的邏輯,因此這個架構并不能做出世界模型。
肖然:即便算力問題得到緩解,我們仍然面臨著代際算法差異的挑戰。目前,國內的大模型技術多在復制和追趕國外的成就,并嘗試做成功產品的理解和復現。但真的去做一些研究,比如Transform架構的根本突破在哪里,國內相關的討論又太少,我們需要更多的聲音和研究來探討和實現下一代的算法革新。
在應用層面,國內的大模型應用多集中在企業內部,而國外的模型精度更高,To C產品更為豐富。這背后的核心原因在于底層模型的成熟度差異。國內企業被迫去做模型微調和基礎算力設施,通過這些應用手段,提升模型在特定領域的精度。
我樂觀估計,國內的算力問題正在得到國家層面的有效解決。但同時,我擔心的是,當我們解決了算力和模型精度問題后,國際上可能出現新的算法突破,而科技巨頭會效仿OpenAI選擇閉源,屆時我們就會被拉大算法的代際差距。
3.AI太重要了,企業多模型部署“留后路”
51CTO: 具體到國內企業部署和采用大模型,你們發現有哪些值得關注的特點,或者一些有趣的現象?這背后的深層原因是什么?
朱雷:我觀察到國內企業往往會同時部署多個大模型。在與各行各業的企業接觸中,包括央企和上市公司,我發現他們會同時采購兩三家公司提供的大模型,并結合一些開源模型進行微調。這些企業會利用向量數據庫和增強工具,使得基于大模型構建的應用背后有多個模型支撐。
這種現象背后的原因可能有幾個方面。首先,AI大模型目前被認為非常重要,因此企業愿意投入較多預算。隨著開源能力的提升,大模型的部署成本已經降低,盡管后續的數據清洗和模型推理可能成本較高,但采購模型本身已經變得相對便宜。
其次,當前大模型的能力還比較有限,特別是在特定行業的應用上。這就導致企業在應用大模型時會部署多個模型,以期望不同模型在不同方面的能力可以互補。
最后,AI的重要性不言而喻,但企業對于國內大模型的發展前景還不太確定,因此他們傾向于嘗試多個模型,以觀望哪個模型能夠更好地發展,以免選錯后對企業造成較大損失。
肖然:從成本來看,盡管模型本身的成本已經降低,但與之配套的運維成本卻相對較高。企業在微調大模型時需要投入額外的資源來管理知識庫和優化整個數據處理流程,這導致了需要額外雇傭專業人員來維護和優化這些模型。而部署的多模型,每個基礎模型相對小一些,微調后能達到專事專用的效果。
此外,大型組織更有可能部署自有模型,而小型組織則不太可能考慮這一選項。在大型企業中,各個部門可能會根據自己的需求獨立部署和使用不同的模型。這種分散的部署方式雖然短期內看似效率不高,但實際上有助于保護組織結構擁有一定的自由空間,允許各部門根據自己的業務需求靈活調整。
最后,企業特別希望大模型的能力能夠與現有的工具鏈相結合,而不是完全替換現有的工作流程。例如,企業可能更愿意在現有的辦公平臺上集成模型來輔助工作,比如釘釘AI這樣的設計,而不是遷移到一個全新的系統中去。
51CTO:企業的模型部署、AIGC應用等等由哪個部門負責?
肖然:數字化能力強的公司可能會成立專門的人工智能中心,來負責模型和算力的相關工作,而應用則由具體實踐這些工具的相關部門負責。
在為企業部署AI能力時,負責牽頭的角色往往是CIO或CTO。然而,隨著人工智能戰略的重要性日益增加,一些企業包括我們自己公司開始設立CAO(Chief AI Officer)來專門負責人工智能戰略的制定和執行。從長遠來看,或許越來越多的企業會設置類似CAO的崗位。
巴川:我們公司算是一個典型的中型互聯網游戲公司,我們有一個技術中臺,其中包括大數據、機器學習和深度學習等方向。技術中臺自然成為了大模型應用的主要推動者。同時,我們的業務部門,比如說美術部門、銷售部門,也在自下而上的擁抱技術變革。
我們也在嘗試多個模型,因為目前還不清楚哪個模型更合適。在這個過程中,我們會直接調用接口,也會對大模型進行微調。這其中涉及到成本和產出比的問題,業務部門會根據業務場景直接評估性價比,決定是否值得投入。
然而,技術部門在推動大模型應用時,可能會發現性價比并不高,這時我們的步伐就會受到限制。一些大模型,比如馬斯克最近發布的Grok開源大模型,雖然下載不難,但能運行起來的機器需要200萬成本,這就需要我們仔細考慮場景的適用性和成本效益,雖然我們自己也很好奇效果,但如何能說服管理者批預算是個難題。
對于中小公司來說,通用大模型的成本可能是難以承受的,可能需要大廠或國家意志整合資源才能實現。此外,我們也在思考,專注于特定業務場景的大模型是否會讓我們離AGI越來越遠。
4.“新質生產力”AI+,已經敲開了技術變革的門
51CTO:隨著大模型采購成本下降以及垂類模型的成熟,所有企業都應該擁抱大模型嗎?AIGC能在未來成為所有企業的剛需嗎?
巴川:隨著成本不斷下降,我認為中小企業完全有可能開始使用大模型。在形式上,他們可能會更多地選擇直接調用現有的大模型接口,利用其能力來降本增效,并在特定的市場業務場景中創造價值。而大型企業,如百度、阿里,可能會開發自己的模型,以保持技術壁壘和市場競爭力。
從國家層面來看,整合資源開發具有自主知識產權的大模型也是非常重要的,這不僅是技術追求,也是社會責任的體現。必須有人去開發大模型這樣的基礎設施。
肖然:AIGC就屬于國家提出的“新質生產力”這個概念,隨著技術的進步,未來的情況將與現在大不相同,盡管可能不會有像iPhone那樣的顛覆性時刻,但人工智能的應用仍會讓人眼前一亮。
從這個角度來看,并不是所有企業都需要自己部署模型。隨著問題逐漸被解決,特別是走向AGI時,企業可能不再需要自己擁有模型。正如黃仁勛所說,“打敗你的不是AI,而是使用AI的人”。
朱雷:雖然大模型和AI技術的成本正在下降,但目前大多數企業的核心業務流程還不能依賴于大模型。目前,大模型的應用主要集中在相對邊緣的業務上,成本的降低并不直接等同于可以落地實施。真正要影響企業核心業務的落地,除了成本,還需要模型在準確性和推理速度上達到可用的水平,而目前這個階段還有相當大的差距。
5.“賣鏟子”是門好生意,引領應用新趨勢是“天花板”
51CTO:如何判斷一款AIGC應用是否優秀呢?有什么標準嗎?
巴川:我會首先考慮合規性,這對于公司的業務至關重要;其次,AIGC生成的內容是否有C端用戶愿意買單,這是一個直接且重要的評判標準;此外,我希望能夠看到應用中有些特色,能夠把相關的數據積累用起來,形成一定的壁壘。
肖然:我認為這個時代值得做的生意就是“賣鏟子”。使用AIGC技術提供工程化支持的工具和服務——是一個有前景的事情。直接做大模型的門檻太高了,不適合一般的玩家入場。無論AIGC應用是面向C端還是B端,都需要將這些技術工程化、規模化,讓組織能在內部享受到AI技術帶來的便利。
如果涉及到直接面向消費者的應用,我會在合規的基礎上增加對高頻場景替代的考量。我喜歡那些能夠改變用戶習慣、增加用戶粘性的應用。
朱雷:從長遠來看,我認為AIGC應用在交互方面還有很大的創新空間。盡管目前市面上已有一些成熟的交互模式,如智能音箱和流程機器人,但未來可能會有新的交互模式出現,特別是適合AGI的新型交互模式,我期待在國內看到這樣的創新。
本文轉載自 ??51CTO技術棧??,作者:伊風
