嘉賓 | 張杰
采訪 | 張曉楠
編輯 | 徐杰承
出品 | 51CTO技術棧(微信號:blog51cto)
“2018年,隨著Transformer預訓練模型的興起,自然語言處理(NLP)學術圈中形成了一個主流觀點——NLP領域的不同技術方向,如文本分類、文本匹配、序列標注等,最終都會被歸結到文本生成這一核心任務之下。”這是中關村科金技術副總裁張杰在訪談伊始便提到的一項關鍵洞察。
作為領先的對話式AI技術解決方案提供商,中關村科金自2014年成立以來便選擇聚焦生成式AI技術,專注于企業服賽道提供對話場景服務。并在過去數年中,基于對AI技術棧的全面布局,先后構建了數字化洞察與營銷、數字化服務與運營、數“智”底座三大產品矩陣。
ChatGPT引爆大模型熱潮后,AI技術積淀深厚的中關村科金也在第一時間選擇了全面擁抱大模型,并于2023年11月正式發布了國內首個企業知識大模型、AgentGraph應用開發平臺,以及“超級員工”系列AIGC應用,成為了國內大模型應用領域的先行者之一。
本期T·TALK訪談欄目,我們特別邀請到了中關村科金技術副總裁張杰,希望能夠通過這場對話,了解到這位經驗豐富的技術專家對于AI行業發展的認知與判斷,以及中關村科金這家頭部智能科技企業在大模型技術與應用領域所積累的寶貴經驗。
1.大模型落地的切入點
根據張杰的介紹,此前,行業內普遍會將對話式AI認為是企業與客戶溝通的一座橋梁,尤其是在數字化轉型的背景下,這座橋梁的主要作用通常會被歸結為提升溝通效率與用戶體驗。
然而隨著大模型技術的火爆,業內開始逐漸意識到了對話式AI的更大潛能——“以中關村科金為例,現在我們認為對話式AI在大模型所提供的理解和生成能力加持下,可以通過在對話過程中對企業知識的提取,升級成為企業知識管理甚至是企業群體智能的入口。”
因此在張杰看來,當前很適合大模型落地破冰的切入點,便是面向企業的知識問答場景。常規的企業知識庫會包含大量的各式文檔,并不利于整理和查詢,如今只需要將這些知識信息交給大模型進行處理,便能直接通過對話形式進行關鍵信息檢索。
這不僅能帶來成本上的效益,企業不再需要大量人員對文檔進行標注整理。且基于大模型的控制,所生成知識信息在合規和可控性上的表現也會更好。更重要的一點是,企業知識中臺并非孤立場景,除了賦能內部員工外,對外部客戶的觸達連接,例如營銷、客服等,也都存在著很大的想象空間。
目前,中關村科金AIGC應用知識助手已成功服務銀行、證券、財富管理等多個行業客戶,包括頭部證券公司。在證券行業實踐中,基于大模型內容生成能力,為客戶經理生成不同對客階段、多樣化的客戶營銷話術,營銷文案撰寫時間從10分鐘縮短至10秒,高效輔助客戶經理展業,提升客戶經理對客服務的專業性。在財富管理行業實踐中,為智能客服產品賦能,大幅提升客服系統問答意圖識別準確率和回復準確率,減少70%以上的系統運營工作,幫助企業實現更加智能、成本更低的客戶服務。
“2022年ChatGPT發布后,大模型實現了從學術圈一直到朋友圈的破圈;2023年則是大模型破冰的階段,無論是基礎大模型還是領域大模型廠商,都在積極尋找試點應用場景;而2024年將很有可能會是大模型應用涌現的一年,各種業務場景都會選擇擁抱大模型。”張杰如是說。
2.模型與知識的有機結合
作為國內頭部的對話式AI技術解決方案提供商,中關村科金在多年的經營歷程中積累了豐富的企業級客戶服務經驗。在企業數字化轉型的過程中,張杰總結到,無論在大模型火爆前后,客戶對待產品的態度都無外乎兩種——足夠新穎亦或是足夠實用。
因此,通用大模型并不能成為當下企業服務的統一解決方案。通用大模型更強調泛用性,即便模型綜合能力很強,但依然會面臨一個法則,便是“通用的不好用,好用的不通用”,所以想要解決企業不同業務場景下的特定問題,還需尋找新的突破口。
中關村科金基于對大模型技術的綜合判斷,探索出“大模型+領域知識”的發展路徑,在領域大模型的基礎上又提出了企業知識大模型。由于許多知識密集型企業不允許模型存在幻覺問題,這便需要將特定領域知識和語言模型進行有機結合。
企業知識大模型助力構建“企業知識大腦”。例如在制造業,沒必要訓練領域大模型記憶特定企業每款零件的各種細節數據,只需要將信息儲存在企業知識庫,并由企業知識大模型進行信息的挖掘與讀取,并從中篩選出用戶所需的知識點。
張杰表示:“企業知識大模型不與具體領域綁定,更多用于處理不同結構的數據源,并將非結構化的知識轉化為大模型能夠快速查找的知識庫,沒有領域特性的特點,也使其能夠被更廣泛的應用于不同行業的不同業務場景中。”
3.軟件工程新范式
根據張杰的介紹,隨著企業AI應用場景的不斷豐富,很多應用創意將產生在業務部門,他們需要更加簡易高效的研發平臺快速驗證idea,而不是將任務全部交由科技部門慢慢立項研發。
而對于如中關村科金這樣具備多樣產品體系及完備產品矩陣的企業而言,大模型應用開發平臺能夠幫助交付人員提高產品的研發和迭代效率并降低成本。所以,中關村科金在推出企業知識大模型的同期上線了AgentGraph應用開發平臺。
“基于智能體的應用開發平臺將會是一個大的趨勢,這將可能會帶來軟件工程的新范式。”在軟件工程2.0時代,數據格式都需要人為進行預定義,但在大模型時代,基于模型對多模態數據的理解,預定義數據結構這項沿用許久的傳統勢必將被顛覆。
關于AgentGraph應用開發平臺的特點,張杰也給出了這樣的介紹,“AgentGraph平臺分為兩層,底層為原子能力,場景組件中封裝了大量行業KnowHow,上層則采取拖拉拽即可實現的零代碼流程編排畫布。能夠低成本的鏈接模型能力和應用場景,是AgentGraph的核心優勢。”
張杰表示:“我們希望通過AgentGraph構建一個生態開發平臺,把應用開發的權限從算法工程師、IT人員手里開放出來,業務專家可以通過低代碼、拖拉拽的方式,快速調用AI底層能力,實現場景應用落地。”
4.產品革命
無論技術亦或是工具的演進,最終所影響的都是產品的迭代和創新。相較于此前基礎的AI技術,大模型所能提供的語言理解能力更強,這意味著在大模型的賦能之下,傳統AI產品的能力覆蓋率將會迎來質的飛躍。
例如在一些客服質檢場景,傳統方法是利用關鍵詞識別,去判斷涉及敏感內容或辱罵性的詞句。而依托大模型的語言理解能力,基于大模型所構建的質檢系統,一些不含有敏感詞但句意為辱罵或涉及違法的內容也將能夠被準確識別并抓取。
另外,在我們熟悉的營銷領域亦是如此。原先做營銷外呼需要將產品話術及對話SOP提前設定好,然而即便如此SOP也沒法窮舉客戶的不同狀態,例如客戶在開車亦或開會時該怎么做,傳統營銷系統都難以應付。大模型則只需要通過一些績優話術的訓練,便能夠基本達到人類業務員的水準。
目前中關村科金主推的一大產品應用便是能夠服務營銷、客服、行政、財務等諸多不同業務場景的虛擬員工助手。不同業務場景的虛擬員工都源于同一套技術路徑,即底層能力來自大模型及AI原子能力,以支持信息抽取、文本理解及內容生成。
對于企業最關心的大模型落地成本與安全性問題,張杰也總結了一些自己的觀點和中關村科金目前所提出的解決方案。在企業私有化部署時,很多場景不需要太大體量的大模型,更沒必要從0到1訓練基礎模型。很多時候幾十億、幾百億參數的小模型就能解決具體問題,加之應用云服務,部署大模型及訓練的整體成本并不會過高。
安全層面,中關村科金則提出了一套新的安全體系,通過數據清洗、隱私脫敏、合規加訓、提示工程約束與傳統合規質檢五層安全防護的處理,以確保大模型以及基于大模型所構建的系列應用能夠盡可能擺脫幻覺問題的困擾。
5.大模型的應用高地
“隨著技術和應用的不斷成熟,大模型的應用場景將變得非常多,知識密集型行業將最有可能率先成為大模型落地的高地,例如金融、制造、政務等。”在回答有關大模型領域未來發展趨勢的問題時,張杰提出了自己這樣的判斷。
金融業有著許多大模型應用落地場景,這是由于金融業擁有較強的數字化基礎,且每一點小的突破都能帶來可衡量的收益。在銀行、保險、證券等行業的營銷、服務等業務場景中,大模型都能夠對業務人員形成很好的賦能。
此外,如制造、政務等領域,雖然仍在數字化進程中,但它們的共同點便是行業內都存在著海量信息,利用大模型將這些知識碎片收集記憶起來,按需賦能給相關人員,將能夠顯著提升多種場景下業務人員的工作效率。
張杰強調稱:“任何技術從前沿的突破,到工程化、產品落地試點,再到大規模落地,都會有一個技術應用的生命周期。現在大模型技術非常火爆,雖然在應用過程中還需要一段的時間積淀,但在未來三到五年,這一領域將會充滿機遇。”