作者丨千山
出品 | 51CTO技術棧(微信號:blog51cto)
大模型很時髦,但大模型不賺錢。
歸根結底,大家有共識:一則看好大模型不等于立刻就要用上大模型,大模型的供需兩端依然存在著難以逾越的鴻溝;二則即使大模型未來會成為產業變革的關鍵變量,但誰也不知道,大模型的應用何時會真正從非核心環節的試點進階為核心業務場景的剛需。所有人都是摸著石頭過河,沒有先例可以借鑒。
因此吆喝者多,獲益者少。觀望者多,落地者少。
我們知道,金融產業一貫是新技術的早期采用者,不僅有著良好的數字化基礎,而且很早就開始了在AI方面的探索,可以說是AI產業化的“優等生”。因此有人覺得金融是大模型落地的首選。但事實上,金融與大模型之間,“兩張皮”的現象同樣屢見不鮮。
一、技術焦慮下,錯位的訴求
今年3月,以彭博發布BloombergGPT為標志,這個號稱專為金融行業打造的500億參數大語言模型,拉開了金融大模型混戰的序幕。隨后,國內不少金融機構、金融科技公司紛紛落子大模型:
- 5 月下旬,度小滿推出國內首個千億級中文金融大模型“軒轅”;
- 6月28日,恒生電子發布金融行業大模型LightGPT;
- 8月28日,馬上消費發布國內首個零售金融大模型“天鏡”;
- 9 月8日,螞蟻集團發布工業級金融大模型,同時對外開放Fin-Eval金融AI任務評測集;
- 開源金融大模型領域,FinGPT、貔貅(PIXIU) 、聚寶盆(Cornucopia)也次第而來。
有研究數據顯示,截止至今年9月,國內參數在10億規模以上的大模型數量已有116個,其中金融行業大模型約18個。
別看金融大模型提供方你追我趕、一派熱鬧,但行業用戶依舊保持著相當審慎的態度。
根據恒生電子的調查,盡管金融行業整體對大模型的關注和參與意愿比較高,但真正落地比例較少。在受訪用戶中,8%處在立項階段,17%處在測試階段,迄今為止約70%的金融機構對大模型仍處于調研階段。
供求雙方的“脫節”主要體現在:兩者身處的語境不同,訴求錯位。
當模型提供商在匯報自己的大模型參數規模,語料的豐富性,tokens的大小,以及一堆評測結果時,行業用戶對此往往興趣寥寥,他們更關注的是大模型到底可以用在哪些地方,有沒有成功先例,一定要用大模型嗎,小模型為什么不可以等問題。
對于大部分大模型提供商來說,在這場競逐中,現階段能不能成為贏家還是次要,先拿到入場券才是至理。因此,我們看到了形形色色的自研大模型或基于大模型打磨的產品與服務。簡言之,先上牌桌,再論勝負。
對于金融組織來說,無論是頭部機構還是成長型機構,在技術焦慮的驅動下,普遍對大模型接納良好,不過具體到實戰還是存在諸多挑戰。
首先,“由誰主導”。金融機構覆蓋了較多的企業類型,銀行、保險、證券、基金等等,不同類型的機構需求也不同。以銀行為例,掌握大量的私域數據,而且合規風控較為嚴格,在此前提下進行大模型應用探索,必然以自身為主導,而不是將主動權讓渡給技術公司。比如,此前在交行發布的2023年半年報中,就明確提出“制定生成式人工智能建設規劃,組建GPT大模型專項研究團隊”。
其次,“如何選型”。對于金融機構來說,到底是選擇通用基礎大模型還是行業大模型;是以私有化形式部署,還是調用API接口來獲取服務都是需要權衡利弊的問題。如果與第三方合作私有化部署大模型,那合規與數據安全相對有保障,但成本不菲;如果選擇MaaS模式,通過API調用來獲得大模型服務,成本將顯著下降,但相應風險也會隨之提升。
再者,“如何準備”。大模型要訓練,訓練的語料從哪里來,如果用自己的,是否做好準備,如果用別人訓練好的,又該如何應對不同場景的“質”和“量”的要求;數據方面,尤其是私有數據如何部署,才能滿足合規性;算力方面,需要多少算力支撐,算力緊張怎么辦;預算方面,要投入多少錢。這些都是需要做到心中有本賬的地方。
最后,“如何運營”。大模型的應用要產生實效是不可能一蹴而就的,上線僅是第一步。如何讓場景驅動下面的垂直應用開發不斷提升成熟度,切實發揮效能提升作用;如何讓私有數據、公有數據,以及海量實時數據形成數據閉環,乃至進一步形成數據飛輪都是關系到大模型持續發展的關鍵問題。
恒生電子董事長劉曙峰表示,在大模型實際落地過程中主要存在模型選擇難、算力供應不足、應用成熟度不足等問題。他談到,在一定的角度來看,大模型的應用不僅僅是技術能力的問題。長期發展來看,大家的技術能力可能會趨同,此時關鍵的是應用新技術的速度、新技術場景的建設和客戶運營能力的建設。
新技術的率先應用的確可以帶來紅利,但這種紅利是建立在場景之下,業務切實帶來增長的基礎之上的。目前來看,由于供需雙方都還處于摸索階段,生活在兩套話語體系之中,金融行業的大模型落地還遠遠未走到這一步。
二、籠中的行業,幻覺里的大模型
金融與大模型的“兩張皮”現象不只存在于供求雙方之間,還存在于行業需求與大模型本身的能力之間。
理論上講,大模型可以在金融行業找到很多不同的應用場景,比如智能客服、投研投顧、信貸風控、智能營銷等等,但找到場景,對癥下藥,試點成功,是否就能規模化推廣,然后徹底起飛呢?并沒有那么簡單。
一方面,金融業在數據治理、行業監管、信息安全方面有其行業特殊性。
以銀行為例。農行安徽分行副行長徐偉對記者談到,在實踐中銀行應用AI大模型可能會遇到以下挑戰:
1.數據質量問題:大模型需要大量的高質量數據進行訓練。目前銀行大模型所要用到的數據在質量、一致性、完整性、準確性方面還有待進一步提升,這會影響模型的學習和性能。
2.行業合規性和監管問題:銀行業需要遵守各種法律合規性和監管要求。在使用大模型進行風控、投研等任務時,需要確保模型的算法透明、可解釋,能夠被審計和追溯,同時符合相關法律法規要求。
3.用戶隱私和安全問題:銀行涉及大量的用戶信息和交易數據,在使用AI大模型進行客戶服務、風控等任務時,需要保護用戶隱私和數據安全,防止信息泄露和數據濫用。
4.算力需求問題。大模型對算力要求高,各個應用的訓練、推理需要大量資源和算力,目前無法支撐全場景使用。
在徐偉看來,正是基于以上問題,“現階段大模型較為適合在對內服務、輔助支撐、內容生成等場景試點,而在監管相關、準確性敏感型場景、數據敏感型場景、直接面客場景的使用是受限的”。
另一方面,正是由于金融行業對準確性和可控性的要求極高,現行大模型的訓練機制下,難以完全消解的幻覺問題成為了大模型應用落地過程中的重大障礙。
大模型有時會生成錯誤且具有誤導性的結果——通常被稱為“幻覺'。隨著AI模型的完善和學習,這些失誤在某種程度上是意料之中的,甚至在某種程度上可以被視作是其創造性的衍生品。但在精度不容妥協的金融領域,其影響是嚴重的。因此,現階段大模型能力不足以參與到關鍵業務流程的決策,即使是在非核心業務場景的應用也需要結合人工審核。
九章云極DataCanvas副總裁于建崗對記者表示:當前大模型的訓練機制其實很難完全消除幻覺問題,只能用各種方法來緩解,甚至于用其他的方式(模型或者rule)來后期消除,所以目前很多的應用更多地是把大模型作為copilot來提供。不過對于未來,他依舊保持樂觀態度。
“大模型是新事物,本身也需要一個發展進步的過程。隨著大模型技術的發展,相信在訓練方式甚至于transformer上都會有革命性的變化。另外,我們一直認為未來應該是‘大模型+小模型’的時代,就是說大模型能夠在規劃和邏輯推理方面提供很強的能力,對于一些需要精準結果和預測的應用依然可以用小模型來提供, 這樣相結合的方式能夠在一定程度上解決當前的問題。”
三、場景之下,通往未來的兩枚拼圖
縱然大模型在金融行業的落地充滿了挑戰,但是不可否認,金融業在AI應用的積累上是有先天優勢的。基于機器學習的風控、營銷、投研決策,早已是金融機構推進數智化轉型的重要組成部分。
相比傳統AI,基于大模型的AI讓大家看到了一種通用型的AI能力的賦能,即能夠以類人的思維來處理很多復雜的推理、邏輯、規劃、任務執行的能力。大模型也的確能提供很好的增益。其學習能力、理解能力、內容生成能力、預測能力都在為金融領域開啟一扇新大門:在海量數據場景下為金融機構提供更全面、更深入的市場洞察、分析預測,更復雜的風險管理、客戶服務。
當前,越來越多的金融機構愿意嘗試將其應用在特定的業務場景中,其中智能客服是被普遍看好的領域之一。比如,美國互聯網保險公司Lemonade推出了基于GPT-3技術面向用戶的銷售機器人瑪雅(AI.MAYA)。
傳統的智能客服機器人對用戶來說并不陌生。但由于智能化程度有限,經常會出現面對復雜問題無能為力或答非所問的情況。在此背景下,大模型技術的出現為智能客服的進階帶來了希望。
依托海量參數,大模型有更好的自然語言理解和內容生成能力,結合人類反饋強化學習,可以實現更擬人、更安全、更高質量的任務反饋。加之更強大的學習能力,可以更好地泛化到未見過的數據上,在面對新問題時能夠更好地適應和解決。
另外,投研投顧也是熱門場景之一。有來自券商的內部人士表示,他們對大模型在投顧場景的應用很感興趣。以往AI投顧機器人的回答比較生硬刻板,如果大模型可以在合規準確的前提下更貼近用戶需求,那無疑將讓投顧服務體驗更上一層樓。
近日,螞蟻集團發布的支小寶2.0和支小助兩款大模型落地產品同樣聚焦在客服及投研領域——前者面向投資者,可以提供行情分析、持倉診斷、資產配置和投教陪伴等專業服務;后者為從業人員在投研分析、信息提取、專業創作、商機洞察、金融工具使用等環節提供服務。
據官方介紹,支小寶2.0的金融意圖識別準確率達到95%,能夠理解用戶情緒,主動進行多回合的高質量對話,甚至因人而異調整溝通風格。回答用戶提問后,還會自動“反思”準確度、自我糾偏。
如果說大模型為金融業描繪的“未來已來”畫卷是恢弘而神秘的,那么智能客服和投研投顧兩大場景就像這幅卷軸里最清晰的兩枚拼圖,為我們稍稍勾勒出了解碼未來的一點輪廓。
當前金融大模型已經在個別業務場景表現出了不錯的潛力,一方面提升原有AI功能,變得更通用、強大、高效;另一方面,提供新功能,為降本增效、改善用戶體驗提供更廣闊的想象空間。未來,要讓它發揮更大價值,仍需讓應用場景從零星試點走向規模化應用,讓AI原生應用從非核心場景走向關鍵業務場景,彼時,大模型才能迎來真正起飛的高光時刻。
四、乾坤未分,笑到最后者笑得最好
“這是一個最好的時代,也是一個最壞的時代。”
在這個不確定性成為常態的時代里,大模型的興起讓所有人措手不及,有人興奮,有人質疑。向來不吝于嘗試新技術的金融行業也被裹挾其中,一路向前。
這是一場技術實力的較量,也是一場商業生態位的較量。
技術上,重新定義人機交互方式和專業應用程序,在大模型基礎上進行AI原生應用的開發;業務上,推進大模型落地,把握其對于業務形態和邏輯范式的革新,實質性改善用戶體驗,實現效率質的飛躍;生態上,預見既有的基礎設施以及管理體系的顛覆,在大模型生態中形成從上到下的能力,在技術趨同之際打造自身的護城河。
大模型時代,乾坤未分,玩家眾多,前方也許群星璀璨,也許一枝獨秀。但能脫穎而出的,必然是敢為人先的冒險家,也必然是長期主義的踐行者。