恒生電子首席科學(xué)家白碩：長文本和多模態(tài)是生成式AI落地金融的兩大利器

發(fā)布于 2024-5-17 18:12

瀏覽

0收藏

嘉賓丨白碩

采訪/撰稿丨張潔

編輯丨千山

出品 | 51CTO技術(shù)棧（微信號：blog51cto）

在千行百業(yè)中，金融業(yè)一貫是新技術(shù)的早期采用者。無論是在數(shù)字化水平，還是在關(guān)于產(chǎn)業(yè)AI化的探索上，都走在了前列。因此，金融業(yè)也被視為生成式AI應(yīng)用落地的潛力股。

然而，我們也應(yīng)該清醒地認(rèn)識到，生成式AI目前仍處于起步階段，其在金融領(lǐng)域的廣泛應(yīng)用還需要時(shí)間的沉淀。

此外，大語言模型在實(shí)際生產(chǎn)環(huán)境中還面臨著諸多挑戰(zhàn)。例如，引入這些模型后，金融機(jī)構(gòu)能從中獲得多大的經(jīng)濟(jì)利益，其投資回報(bào)率是否明確，以及如何有效解決大模型可能產(chǎn)生的幻覺問題，確保模型在產(chǎn)業(yè)應(yīng)用的最后一環(huán)能夠順利落地，都是亟待解決的關(guān)鍵問題。

此次AIGC實(shí)戰(zhàn)派特別邀請了恒生電子首席科學(xué)家白碩來聊一聊生成式AI在金融行業(yè)落地的那些事兒。

白碩認(rèn)為，金融業(yè)是擁抱AI最積極的行業(yè)之一，也是有實(shí)力將其做深做精的行業(yè)。然而一體兩面，不可忽視的是，鑒于其業(yè)務(wù)性質(zhì)，金融業(yè)對風(fēng)險(xiǎn)因素極度厭惡。同時(shí)，應(yīng)用生成式AI需要成本投入，包括購置算力和進(jìn)行持續(xù)預(yù)訓(xùn)練，全面鋪開仍然需要時(shí)間。金融機(jī)構(gòu)和AI服務(wù)提供者需要聯(lián)合共創(chuàng)和試錯(cuò)，才能踐行價(jià)值、提升體驗(yàn)。

論點(diǎn)先導(dǎo)：

金融行業(yè)樂于擁抱 AI。但金融業(yè)天性謹(jǐn)慎，極度厭惡新技術(shù)帶來的風(fēng)險(xiǎn)因素。
真正能夠落地并滿足剛需的場景需要時(shí)間打磨，不是馬上就能實(shí)現(xiàn)的。
你擔(dān)心模型會(huì)“說錯(cuò)話”，究其根本就表明你對它的技術(shù)成熟度是不那么信任的。
要保證大模型輸出內(nèi)容的可控，主要有三種模式：內(nèi)嵌、外掛、上傳。
一是長文本，一是多模態(tài)，只有這兩個(gè)能力不斷發(fā)展，才能更好地滿足我們的場景需求。
不建議廣大中小金融機(jī)構(gòu)去自建大模型或者自訓(xùn)大模型。
針對多任務(wù)支持，采用適中規(guī)模參數(shù)模型，但可以用多塊卡多部署幾套，滿足高并發(fā)需求。
未來大模型發(fā)展是否能在“大力出奇跡”之外走出另一條路，值得期待。

（為了表述更為流暢，以下采訪內(nèi)容做了部分文本整理）

一、讓子彈再飛一會(huì)兒：真正能落地并滿足剛需的場景仍需時(shí)間打磨

AIGC實(shí)戰(zhàn)派：當(dāng)前金融行業(yè)中生成式AI的整體應(yīng)用程度如何？

白碩：金融行業(yè)是擁抱新技術(shù)最積極的行業(yè)之一。一方面，它的人才結(jié)構(gòu)和業(yè)務(wù)本身的數(shù)字化水平較高，這決定了其有足夠動(dòng)力來擁抱和落地新技術(shù)。

但另一方面，金融業(yè)天然謹(jǐn)慎，極度厭惡新技術(shù)帶來的風(fēng)險(xiǎn)因素。這是由金融業(yè)務(wù)本身（屬性）所決定的。它希望在落地過程中能夠遠(yuǎn)離風(fēng)險(xiǎn)、控制風(fēng)險(xiǎn)。如果新技術(shù)面臨一些諸如合規(guī)、政治正確、誤導(dǎo)用戶的風(fēng)險(xiǎn)，那么這個(gè)行業(yè)會(huì)試圖盡量排除這些因素。

因此，我們可以看到：首先這個(gè)行業(yè)有利于創(chuàng)新技術(shù)的發(fā)展。只要這些技術(shù)能夠帶來價(jià)值，那么金融業(yè)會(huì)是不錯(cuò)的值得深耕的土壤。但同時(shí)也要慎重考慮風(fēng)險(xiǎn)因素，如果沒有特別落到實(shí)處的解決方案，新技術(shù)的應(yīng)用也不會(huì)有很快的節(jié)奏。

另外，在與金融機(jī)構(gòu)的同仁們交流中，我們發(fā)現(xiàn)，還有不可忽視的一點(diǎn)是：他們想擁抱AI，但是使用AI的成本并不便宜，尤其是購置算力和對模型進(jìn)行量身定制的成本。有些非常有實(shí)力的金融機(jī)構(gòu)還需要自己進(jìn)行持續(xù)的預(yù)訓(xùn)練。模型越大，需要的算力支持越高，這是大家不得不考慮的成本因素。

從落地的順序來看，一開始大家可能會(huì)去找比較容易落地的場景試水，但這一塊不一定是剛需。真正能夠落地并滿足剛需的場景需要時(shí)間打磨，不是馬上就能實(shí)現(xiàn)的。

目前，我認(rèn)為我們應(yīng)該認(rèn)識到AI的價(jià)值。局部已經(jīng)開始使用AI，個(gè)別業(yè)務(wù)可能會(huì)先試先行，但全面鋪開并翻新IT架構(gòu)還需要時(shí)間。需要金融機(jī)構(gòu)和我們這樣的AI服務(wù)提供者之間的共創(chuàng)和試錯(cuò)，才能打磨出既剛需又能帶來價(jià)值、提升體驗(yàn)的場景。可以讓子彈再飛一會(huì)兒。

AIGC 實(shí)戰(zhàn)派：在您看來，當(dāng)前對生成式AI落地構(gòu)成挑戰(zhàn)的因素中，技術(shù)因素更多還是非技術(shù)因素更多？

白碩：說到底，都是技術(shù)因素。為什么這么說呢？你擔(dān)心模型會(huì)“說錯(cuò)話”，對它是否會(huì)“胡言亂語”沒有把握，歸根結(jié)底就表明你對它的技術(shù)的成熟度是不那么信任的。

你擔(dān)心它誤導(dǎo)你的客戶，那這就說明它確實(shí)有一定的出錯(cuò)的概率，有一定的產(chǎn)生幻覺的可能。但是如果AI技術(shù)足夠成熟，那么這些擔(dān)心都不會(huì)是問題。

大家可能會(huì)從各個(gè)不同的方面對大模型及其應(yīng)用存疑。我們行業(yè)老大也非常直白地提到過——輸入怕泄密，輸出怕違規(guī)。

“輸入怕泄密”，就是指金融機(jī)構(gòu)給大模型上傳數(shù)據(jù)，這個(gè)環(huán)節(jié)萬一出現(xiàn)泄密怎么辦？不該被大模型知道的數(shù)據(jù)如果“出獄”了那就會(huì)造成問題。“輸出怕違規(guī)”，就是指大模型生成的內(nèi)容超過了我們的可控范圍，輸出了不該說的話，也非常令人擔(dān)心。

這種不放心的深層原因還是對新技術(shù)沒有信任到那個(gè)程度，技術(shù)本身也沒有發(fā)展到讓行業(yè)信任的那個(gè)程度。所以我個(gè)人判斷，這本質(zhì)上是技術(shù)問題。當(dāng)然，如果長遠(yuǎn)來說，我們相信技術(shù)一定會(huì)不斷地發(fā)展，按照目前技術(shù)迭代的節(jié)奏，未來這些擔(dān)心都不會(huì)是太大的問題。

不過我們也不可能坐等未來。那么，當(dāng)下我們該怎么辦呢？

實(shí)際上，我們可以做一些事情。比如，使用一些強(qiáng)化的手段，去跟金融業(yè)務(wù)需求對齊，這是大模型訓(xùn)練中需要解決的問題之一。另外，設(shè)置好“防線”，讓大模型去使用有充分來源的、可以控制的內(nèi)容，如果它想輸出一個(gè)數(shù)據(jù)，那么我們要求這個(gè)數(shù)據(jù)是有出處的、可檢驗(yàn)的。

我們可以在大模型的個(gè)別部位加上“鎧甲”讓其強(qiáng)壯起來，另外一些部位加上大模型外掛等手段去構(gòu)筑“防線”，以此規(guī)避我們擔(dān)心的問題。這些都是可以暫時(shí)采取的策略。當(dāng)前的應(yīng)對之策和長遠(yuǎn)的技術(shù)發(fā)展，我認(rèn)為兩者是需要兼顧的。

二、為大模型設(shè)置“護(hù)欄”：長文本和多模態(tài)能力成為關(guān)鍵

AIGC實(shí)戰(zhàn)派：如今大模型還不能完全滿足金融業(yè)對于可解釋性和可追溯性的要求。如果要讓它真正落地，需要遵循哪些原則？

白碩：從實(shí)戰(zhàn)的角度看，是有一些辦法去繞開它的短處的。在現(xiàn)階段，首先，在我們自己也并非內(nèi)行的領(lǐng)域，可以請教專家來設(shè)置“禁區(qū)”，由專家提供相應(yīng)的實(shí)例和標(biāo)準(zhǔn)，把這些標(biāo)準(zhǔn)變成可訓(xùn)練的，然后通過訓(xùn)練強(qiáng)化大模型，以便讓大模型擁有這種對齊的能力。

其次，放眼整個(gè)架構(gòu)，我們還要更專注大模型的生態(tài)。我們要讓大模型的生態(tài)是更可控的。因?yàn)樵诤芏嗟臅r(shí)候，我們不采用大模型本身提供的數(shù)據(jù)，只利用它的語言理解能力。大模型的語言理解能力是很過關(guān)的，但是它把握事實(shí)的能力不過關(guān)，我們要盡量揚(yáng)長避短，比如用金融機(jī)構(gòu)信得過的數(shù)據(jù)庫、文檔庫、FAQ來產(chǎn)生輸出內(nèi)容。

那怎么樣控制大模型能夠忠實(shí)地產(chǎn)生這些輸出呢？這里面就不得不提另一個(gè)技術(shù)問題。實(shí)際上，當(dāng)我們把這些信得過的數(shù)據(jù)作為外掛的話，那我們能夠借大模型力的地方就比較少了，靠檢索本身的能力一般來說是不夠的。雖然現(xiàn)在有 RAG（檢索增強(qiáng)生成）技術(shù)，但是這與大模型自身由訓(xùn)練獲得的語言理解能力相比，也是有差距的。

這里實(shí)際上分三種模式。一是內(nèi)嵌，就是把數(shù)據(jù)訓(xùn)練到大模型里邊去。但是缺點(diǎn)在于，它就固化了、過時(shí)了，無法使用最新的數(shù)據(jù)；二是外掛，就像之前提到的，外掛可以保證內(nèi)容的準(zhǔn)確性，其風(fēng)險(xiǎn)是相對可控的。但是要找到最準(zhǔn)確的內(nèi)容來回答問題依然存在門檻，因?yàn)殡x開大模型去做這件事就顯得不夠“聰明” ;三是上傳，就是把可靠的內(nèi)容上傳給大模型，讓大模型就這個(gè)內(nèi)容來回答問題，讓大模型的能力也得到充分發(fā)揮，同時(shí)也能夠比較精準(zhǔn)地命中可控的數(shù)據(jù)和話術(shù)，然后更好地去服務(wù)客戶。

就第三種模式來說，問題在于必須要上傳一個(gè)文檔。

如果這個(gè)文檔很大，大模型能不能全吃得下？在大模型發(fā)展的初期，窗口上下文比較有限，如果是很大的文檔上傳給它，它也吃不下。再比如這個(gè)文檔的對象比較豐富，除了純文本以外，還有圖表、表格、圖片等等數(shù)據(jù)信息，這又牽涉到多模態(tài)的能力。

所以一是長文本，一是多模態(tài)，只有這兩個(gè)能力在不斷發(fā)展，才能更好地滿足我們的實(shí)際場景需求，生成命中率高且精準(zhǔn)可控的內(nèi)容。如此一來，我們的生成式 AI 應(yīng)用質(zhì)量也會(huì)更高，用戶體驗(yàn)也會(huì)更好。令人欣慰的是，在技術(shù)發(fā)展過程中，我們已經(jīng)可以很清晰地看到發(fā)展脈絡(luò)，的確就是在朝這個(gè)方向前進(jìn)。

三、為應(yīng)用找一條出路：在私有部署的限定條件將大模型能力發(fā)揮到極致

AIGC實(shí)戰(zhàn)派：金融機(jī)構(gòu)如何量體裁衣，進(jìn)行大模型選型？

白碩：首先我個(gè)人強(qiáng)烈不建議廣大中小金融機(jī)構(gòu)去自建大模型或者自訓(xùn)大模型。這個(gè)肯定不是出路，因?yàn)榇竽Ｐ途淼脜柡Γ沂侵刭Y產(chǎn)投入。無論算力投入、人才投入、技術(shù)投入、數(shù)據(jù)投入，一般的玩家是玩不起的，而且也沒有必要去跟大家卷這個(gè)賽道。

那么出路在哪里呢？拿別人的模型，按自己的任務(wù)類型做精調(diào)，跟自己的數(shù)據(jù)資源、場景資源去做深度的適配，這才是出路。

我覺得我們恒生電子做對的一件事情，就是幫我們的金融機(jī)構(gòu)客戶去真正地建場景、建應(yīng)用。同時(shí)把大模型選型帶來的影響盡量規(guī)避到最低，尤其在很多只能做私有化部署的場景中。我們希望在私有部署這樣的限定條件下將大模型的能力做到天花板，這是我們現(xiàn)在正在做的事情。

AIGC 實(shí)戰(zhàn)派：追問一下，具體選型時(shí)有沒有參照的標(biāo)準(zhǔn)？

白碩：用參數(shù)體量來說的話，就是50B到100B之間。這個(gè)區(qū)間內(nèi)的大模型，其語言理解能力、通用知識儲備，和其規(guī)模本身所需要的算力（尤其在不做訓(xùn)練只做推理的情況下）部署的成本之間存在一個(gè)比較好的平衡。

到了50B，即500億參數(shù)，大模型就會(huì)出現(xiàn)“涌現(xiàn)”現(xiàn)象。所以你要讓它的智能稍微看得過去一點(diǎn)，那最好要到這樣一個(gè)量級，讓模型不至于太笨。但如果更高的話，達(dá)到1000億以上，那可能我們部署的成本又要吃不消了。當(dāng)然這是在一定要私有部署的必要條件下，我們覺得比較好的平衡點(diǎn)是上限1000億，下限500億。

另外大模型選型，我們也不建議過于多元化。我們需要模型的多元化來彌補(bǔ)各個(gè)模型的短板，但是過于多元化的話是有問題的，選型本身還是要相對聚焦，把握住幾個(gè)特長方向，各展所長，一般確定兩三個(gè)就可以了。

還有針對多任務(wù)支持，并不意味著一定要用大參數(shù)模型，依然采用適中規(guī)模參數(shù)模型，但可以用多塊卡多部署幾套，不同的任務(wù)用不同的卡去支持，以此來保證高并發(fā)的需求。

四、未來之鑰：“大力出奇跡”之外，或許會(huì)誕生另一條路

AIGC實(shí)戰(zhàn)派：未來幾年內(nèi)，生成式AI將會(huì)如何改變金融服務(wù)的傳統(tǒng)形態(tài)和格局？

白碩：這個(gè)其實(shí)是很難預(yù)測的。站在大模型產(chǎn)品的研發(fā)一線，我們也需要一定的對相關(guān)需求的洞察能力和一定程度的預(yù)判，但是這個(gè)預(yù)判還是有限的，我們看不了太遠(yuǎn)。從我們對技術(shù)本身發(fā)展的預(yù)判來看，如果大模型的長文本能力和多模態(tài)能力不斷提升的話，那我們現(xiàn)有的對大模型的一些判斷是會(huì)改觀的。

現(xiàn)在很多人說大模型會(huì)產(chǎn)生幻覺，甚至?xí)槐菊?jīng)胡說八道，那么當(dāng)文本足夠長，所掌握的數(shù)據(jù)類型足夠豐富的時(shí)候，這種不可控的觀感也會(huì)隨之變化，隨著技術(shù)迭代，很多你最初嘲笑的東西也會(huì)變成你需要仰視的東西。

我相信，大模型整個(gè)生態(tài)的變化對我們業(yè)務(wù)生態(tài)來說，主要會(huì)產(chǎn)生正面的促進(jìn)作用。比如，之前業(yè)務(wù)人員需要求助 IT部門才能做到的事情，如今通過大模型應(yīng)用就做到了。這是最直觀的一個(gè)例子，把業(yè)務(wù)解放出來，降低對IT的依賴，很多零碎的、即時(shí)的、沒有沉淀價(jià)值的需求，就不值得把它再變成一個(gè)應(yīng)用。這是我們近幾年內(nèi)就很可能發(fā)生的一些事情。

再把目光放遠(yuǎn)一點(diǎn)，如今很多服務(wù)是以產(chǎn)品形態(tài)出現(xiàn)的，甚至是以個(gè)性化定制的方式出現(xiàn)的。未來我們可能更多地將能力封裝起來，以可調(diào)用的 API呈現(xiàn)，用戶通過自然語言就可以實(shí)現(xiàn)驅(qū)動(dòng)。雖然看起來有點(diǎn)遙遠(yuǎn)，但我相信這一圖景最終也會(huì)實(shí)現(xiàn)。

最后，綜觀目前大模型的發(fā)展路徑，“大力出奇跡”的路線目前還是占了上風(fēng)。但是代價(jià)在于，我們需要不斷地去堆疊算力。但這條道路繼續(xù)發(fā)展下去，也未必是我們樂見的。是否會(huì)有不耗費(fèi)這么大算力，但智能水平更上一層樓的大模型出現(xiàn)，也是我們所期待的。如果真能取得突破，沒有了算力成本的顧忌，無疑將成為金融業(yè)實(shí)現(xiàn)大模型應(yīng)用的巨大推手。

本文轉(zhuǎn)載自??51CTO技術(shù)棧??，作者：張潔

標(biāo)簽

長文本

AIGC

贊

回復(fù)