?嘉賓 | 譚中意、祝世虎
整理 | 徐杰承
2022年對于人工智能而言注定是值得被銘記的一年,在這一年中,人工智能無論在技術還是產業層面都取得了巨大發展與長足的進步,大量創新技術從概念走向實踐。年初,AI加持下的冬奧為我們帶來了煥然一新的觀賽體驗;年中,AI繪畫從虛幻走向現實并斬獲多項賽事大獎;年末,ChatGPT的橫空出世將再次將這一整年的狂歡推向高潮......
無論是底層技術的一次次突破,還是各類應用的接連綻放,在過去的一年之中,人工智能向我們展示了它的無限可能。為了能更加全面地了解到人工智能領域的發展現狀與未來趨勢,51CTO內容中心特別邀請第四范式架構師譚中意;光大信托信息技術部副總經理祝世虎兩位業內資深專家,共同探討了有關人工智能技術與產業的5個話題,希望能夠從中收獲更多答案。
1、2022人工智能領域的關鍵詞
譚中意:技術層面2022年最熱的關鍵詞無疑是“AIGC”,而在產業層面我想應該是“AI 工程化”或者叫MLOps。因為如今無論是國內還是國外,技術媒體、產品以及風投領域對于AI工程化的關注度都非常高。AI工程化和MLOps的核心理念就是讓機器學習在企業內部更快地實現規模化落地,這也是過去一年人工智能相關產業所最關注的。
祝世虎:從政策角度看,2022年政府主導了數據要素的國家戰略,提出了數據要素是重組全球資源;重塑全球經濟結構;改變競爭格局的關鍵力量。目前中國的 IT 底層的標準、架構、產品、生態,大多是由國外的科技廠商決定的,因此存在諸多的底層技術、信息安全等問題。所以隨著全球的 IT 生態由過去的單級向未來的多級方向去發展,我們需要建設自己的 IT 的底層框架。因此,在信創的背景下,我認為2022年人工智能甚至是整個科技產業的關鍵詞應該是“科技有國界”。
2、前沿人工智能領域技術發展與應用現狀
譚中意:應用層面,在AI工程化領域,第四范式在過去一年將大量自研技術積累進行了對外開源,其中包括線上線下一致性的生產級特征平臺OpenMLDB,能夠實現對快速開發企業內部的實時預測、風控與場景推薦,解決時序特征、高效讀取以及線上線下一致性問題。開源一年多以來,與上下游的開源技術生態形成了良好的合作,也取得了很好的成績。
在技術層面,第四范式始終堅持AI方向的深耕,現階段主要專注于企業內部兩種AI的落地。其一是感知類AI落地,例如CV、NLP。另一種則是決策類AI的落地,針對企業進行策略制定,例如風控、推薦、預測等此類與企業經營密切相關的場景。這一過程中比較重要的兩個關鍵點,其一是將模型以較高的質量進行快速上線;其二則是對模型進行持續的訓練、反饋與調整,使模型始終保持其前沿性與高效性。
對于AI場景較多的企業而言,在這種情況下,一家企業中就能夠產生規模化的效益,實現從量變到質變的躍遷,使企業從傳統的數據公司進化為AI公司,達到通過AI提升核心競爭力的目的。
祝世虎:近幾年金融行業對于人工智能技術的應用已經比較成熟了,過去一年包括未來幾年主要做的事情就是利用金融業務去引領金融科技的發展。例如在消費金融領域,銀行在做消費金融的準入模型時,第一代是規則驅動的模型、第二代是規則 + 數據驅動的模型,第三代則是大數據驅動的模型。
而在現階段,智能算法要解決的一個核心問題就是樣本不足。在實際做智能風控的過程中,我總結一套手冊。例如當數據的維度不足時,第一種方式,可以使用新型特征組合方法AutoCross升維。第二種方式則是當樣本不足時,可以使用遷移學習。當樣本的標注成本較高的時候,很多樣本標注沒有,可以使用Active learning的方法。當樣本標注錯誤率偏高的時候,比如存在外來的一些數據,它標注的數據標簽錯誤率比較高,我們要用Confident Learning的算法。而在當樣本的標簽非常少時,例如在用于交易反欺詐時,這個時候可以選擇用半監督學習的算法。這也是在過去一兩年內總結出的相對成熟的應對方案。
3、人工智能上下游產業市場環境的演化方向
譚中意:未來從事AI應用的技術企業,可能會分為三種。第一種是有資源做大模型,例如擁有海量數據、海量算力;擁有業界頂尖科學家的企業,他們能做出精度很高且普適性較好的大模型,就像AutoAI,他們可能會以API的方式對外提供服務。
第二類則是具備豐富場景的企業,針對各個場景,例如AIGC可以用在各種需要內容的地方,來做出各種的應用。
第三類則是介于兩者之間,更多的是提供工具,能夠幫助兩者做更好的連接,例如保證數據的準確性、保證線上服務的穩定和監控、做模型的版本和Beta這類的企業。
從行業角度講,國內目前AI落地主要集中在企業智能化轉型的相關行業,目前最熱門的行業是金融行業,有場景、有錢。幾乎是每一個AI技術企業必爭的行業。
第二種有前景的是新消費、新零售。新消費和新零售在目前的狀態下,很多企業、很多行業在不斷推出新品,新品的爆發速度是相當快的,而且它們通過現在很多新媒體和新渠道的方式來做,對于營銷、物流、供應鏈方面有很多很多AI的需求。
第三種則是一些制造業,目前重點都還在一些安全檢查、安全生產、故障檢測這種傳統的CV領域,CV領域也能夠提升一定的效率,但是還到不了能夠徹底改變行業工作模式的時候,徹底顛覆可能還需要幾年時間。
祝世虎:從一個AI從業者的職業變化中,我們就很容易了解到人工智能產業的變化趨勢。以個人為例,我最初從事的人工智能算法行業,而后從算法轉做科技,再從科技轉到了做數據,現在又從做數據變成了做業務,這其中實際上是有很深刻的邏輯的。
起初在做模型時,我發現如果沒有科技去承載的話,模型只能嵌入到企業的風險管理中,它只能嵌入管理流程,并不能嵌入到具體的業務中,必須把模型嵌到科技系統中,才能下沉到具體的業務中,所以我從做模型到了做科技。
到了做科技之后,發現了第二個問題,就是對模型和算法而言,數據對模型的貢獻度遠遠大于算法對模型的貢獻度,意識到數據的重要性后,又轉而用科技去做數據去了。做完數據之后,又轉去做業務,這其中有兩個邏輯在里面。第一,模型是基于數據的,數據是基于統計的,統計是基于口徑的,口徑是業務部門定的。但是業務部門在制定業務口徑的時候,往往出于業務的需要,對業務口徑進行戰略性的模糊處理。其次,大多數行業的數字化轉型,本質還是業務去引領的,在產業發展這方面其實也是如此。
4、生成式AI的演進路徑與可能的落地場景
譚中意:生成式AI近期得到了業界的廣泛關注,這的確是一件好事。AI領域這兩年來,大模型的新場景其實是比較匱乏的。而如今ChatGPT之所以讓大家耳目一新是在于,真的讓用戶感覺它解決了很多之前多輪對話解決不了的問題,而且也用大模型的方式生成出了一些比較切實的答案,給大家更多的信心。市場永遠是需要技術熱點的,技術熱點的存在才能保持資本家的信心,而資本家的信心才能夠推動他們掏錢把這些技術更快的落下去。
對于生成式AI的商業化落地,可能會分為三種。第一種,OpenAI這種有錢、有人、有算法,通過API就可以足夠的生成Revenue了。例如AutoCAD這家公司,它的Photoshop現在已經集成了AIGC的部分功能,而另外幾家做AIGC的公司也產生了上千萬的Revenue。這是少數幾家做大模型的公司能做出的事情。
第二類就是將AIGC的能力跟業務場景結合,業務集成商需要尋找很多業務的具體場景,然后再去思考成本、效率等問題,需要很多的設計,如果在剛需、利潤、推廣三方面都能夠實現進步,才能形成很好的模式。
第三類模式也是OpenAI的CEO最近提到的,在這兩者之間還有第三類公司,能對普通的、普適的大模型做Finetune的技術提供商,它能針對一個具體的商業場景,然后對大模型進行針對這種具體商業場景的Finetune,也能夠實現商業落地。
回到根本,都還是需要解決商業或者解決用戶的實際問題,而這是需要不斷地去摸索和嘗試的。我很高興看到AIGC的火,讓大家對AI的事業有更多的信心,也能讓更多的風險投資把錢投進來。我覺得這都是好事。
祝世虎:同樣以OpenAI的ChatGPT為例,它最吸引人的地方在于,每次和它進行溝通,所收獲的內容都不一樣,這也是它最有意思的地方。但從應用的角度來看,這里存在著一個很嚴重的問題,當用戶對這個系統每次輸入同樣的變量時,它返回的變量是不可控的,這就意味著這個AI很難承擔責任。
以前包括現在,我們所使用的智能客服都令用戶感到非常傻,其語料都是事先設定好的。但恰恰是這種“傻”,才使得很多行業敢去使用智能客服,因為其反饋給用戶的每一條信息都是受控的,它的每一句話都是公司能夠負責的。但是當智能客服不可控時,在實用中就會產生很多問題。比如說當一個聯邦學習的公司來推薦聯邦學習算法時,他會介紹這個算法能干什么,但對于很多行業而言,恰恰關注的是我把我的數據聯邦給你了,我的數據使用范圍一定要受控,它一定不能干某些事,我關注的是它不能干什么,而不是它能干什么。
同樣,對ChatGPT來說,我關注的是你的說法一定要在我們能承受的范圍內,你的說法一定要受我們的控制,你不能異想天開的做一些你自己的發散的想法。但是作為技術上來講,很遺憾我們目前還無法實現這點,太過于靈活、太聰明的AI能干出我們很多想不到且難以承擔后果的事,這是做技術和做產業不同的地方。
總的來說,技術的風光和商業模式之間更多的是間接的關系,生成式AI現階段的確能夠幫我我們做一些創造性的工作,但這里的商業模式,目前我們還沒有完全跑通。而在需要更高精確度的工作中,生成式AI需要走的路還很遙遠。
5、未來人工智能技術與行業的結合趨勢
譚中意:AI是一個算法,它與各個企業的結合是必然的,尤其是隨著各個企業做數字化、做智能化轉型的展開,AI+各種企業 + 各種場景,也就是就是AI+everything,已經呈現出了越來越快的趨勢。
未來幾年內的killer app個人認為會是自動駕駛,自動駕駛是AI集大成的應用,它是能在極大程度方便人們出行的應用,當它和車、和路很好的結合,各種算法都能發揮很好的作用,同時又把這種規章制度完善起來,未來五年內能大批落地的、能讓大家耳目一新的killer app很可能會是L4甚至L5級別的自動駕駛。
祝世虎:未來五年之內,證券、股票的自動化交易將變得更加成熟,甚至于取代人類。在這個領域中機器取代人是一個非常明顯的趨勢。并且很值得關注的一點是,此前基于股價因子庫的算法正在被逐漸拋棄。AI未來在自動化交易領域中面臨的最大的問題不會再是股價的變化,而是AI1要和AI2成為交易對手,兩者之間將會是模型的對抗。
也就是學習你的對手會怎么處理這只股票,當AI模擬得差不多時,用戶就可以賺到錢了。所以說AI算法未來會在自動化交易的領域90%甚至99%取代人類,并且未來自動化交易的算法將不再是現在常用的基于因子庫的模型,而會是借鑒博弈論模型對抗的一套理論。而人們要做的,只是選中目標與策略,剩下的全權交給AI就夠了。?