深度評論 | 大數據金融風控大浪淘沙強弱漸分,長路漫漫投機者勿入
2016年,大數據就在一片喧囂的氣氛中過去。之所以說“喧囂”,是從2015年開始的大數據熱在不斷地繼續升溫,加劇。凡事必須跟大數據扯上點關系才算時髦,才算符合時代潮流。
做個最普通不過的統計分析報告,也要冠以“大數據XX報告”。“大數據征信”,“大數據金融風控”,“大數據XX”更是比比皆是。在我看來,真正屬于純粹大數據的項目并不多,多數都在混淆概念。
個人認為,大數據的高潮并未到來。大數據在今天,也并不像大家聽到的那么美好。盡管它的未來很美好,但今天,它還很不“美好”。
一方面,在過去的一年里,大數據確實如我年初所料,正在朝各行業縱深發展,市場在加速,極有可能是一個拐點;另一方面,市場還處于一個量變到質變的過程中,發展的速度恐怕“不盡如人意”。
這里所說的“不盡如人意”并不是貶義,不是由于什么人為的失誤導致產業的發展緩慢,而是一個新興市場發展起來所必須的過程。這一過程只是不如一些投資方所預期那樣呈現“爆發性”的增長罷了。
下面,我將分幾個部分逐一展開我對2016年大數據發展的回顧以及對2017年的一些展望和建議。因為個人在過去的一年里主要做的是大數據在金融領域以及網約車反刷單領域的業務,所以對市場的認知僅限于這兩個領域,文中的觀點可能并不適用其他領域的,歡迎批評指正。
格局
進入一個市場,首先要明白自己扮演的身份是什么,想做什么事兒,賺哪塊兒錢。大數據經過了過去幾年的發展,已經逐漸形成了一定的產業格局。在一些環節上,已經塵埃落定,再無大的機會。
所以,對于每一個從業者來說,如果你還沒有在一個環節,一個領域上占據霸主地位的話,***還是先想清楚,你要掙哪份錢。
年初的時候,我曾經寫過一篇關于大數據產業格局的文章?!洞髷祿荞R圈地的時代已過 逐漸清晰的產業格局將上演“廝殺”》按照從數據源到客戶之間的先后次序,將大數據產業鏈劃分成四個角色,即數據交易商,數據優化商,算法提供商和數據解決方案提供商。這四種角色,也就是我們多數大數據從業公司在市場中的身份。
- 數據交換商,即以數據本身或者數據的粗加工產品作為交易的對象,以賺取數據產品的差價為生意模型。
- 數據的優化商,是指在數據交換商和客戶之間,還存在比較大的數據清洗、數據整理方面的差距,而數據交換商又沒有這方面的能力交付,就需要專業的第三方團隊來為客戶服務。
- 算法提供商,就是以數據建模為擅長,可以依靠算法輸出賺取服務費為商業模型。
- 數據解決方案提供商。前面幾種角色都是客戶清楚地知道自己要什么,通過什么樣的數據,什么樣的處理辦法能解決他們的什么問題,能解決到什么程度。但是在我近幾年的工作中,發現在客戶和數據源之間,具有非常大的鴻溝。用戶既不知道用什么樣的數據,用什么樣的數據處理辦法,來解決他們的問題。因為他根本不知道現在市場上都有哪些外部數據。而市場上號稱大數據的公司有很多,但真正能給他們提供端到端的解決方案的卻很少。這就是我看到的很有意思的一個現象,每家成功的大數據公司的老板基本都是大銷售,銷售人才奇缺。這讓我想起二十多年前,系統集成行業在國內剛興起的時候,幾乎與現在的景象別無二致。
客戶對這一新興的技術還準備不足。而且,比以前的系統集成更不好掌握的是,多數客戶都沒接觸過外部數據本身。所以,勢必存在一個階段,市場上需要有這樣一支隊伍,彌補數據和客戶需求之間的空白。
這就是數據的解決方案提供商,也可以叫做數據的系統集成商。只不過,這次集成的不是別的,而是“數據”。
經過了2016年的發展,我對年初的大數據產業鏈判斷應該有所修正。目前的產業鏈只有兩個半角色,即數據的平臺服務提供商,數據解決方案提供商以及半個算法提供商。
之所以說算法提供商算半個,是因為出于生存的壓力,算法提供商不得不去跟行業接軌,貼近行業,扮演一部分解決方案提供商的角色,而放棄了最初自己的獨立算法提供商的角色。
數據平臺服務提供商,融合了數據交換商和數據優化商的角色。他們既擁有龐大的數據生產能力,也擁有龐大的數據處理團隊。
對后向,他們建成了數據池的體系,不斷地吸收新的數據源來擴充自身的覆蓋范圍和種類;對前向,他們還建成了類似于中間件的數據服務平臺,支持很多數據解決方案提供商來做各行業的解決方案。最終形成“生態鏈”,使數據完成閉環,并流動起來。
這類企業一般都發展了3-5年,得到了資本市場的不斷支持,現在格局已定,對后來者沒有機會了。
數據的解決方案提供商,目前應該已經完成了***輪的角逐。不管是已經做了一年,還是兩年,對后來者還有些機會。這類企業,也多以中小規模為主。
他們的特點是專業,既知道國內數據源的狀況,也做過大量的數據處理項目,更貼近市場,了解客戶的需求。知道使用什么樣的數據,用什么樣的數據處理方法來幫助用戶解決什么樣的問題。他們一般都會鎖定一到兩個行業,深度耕耘。
目前應該已經完成了跟行業的***輪接觸,形成了初步的解決方案和產品,正在向縱深發展。我們團隊就屬于這類。
目前的大數據產業格局并沒有如我年初預料的那樣細分。這說明市場還處于早期,沒有細分的必要。一方面是市場沒有那么多機會可以讓不同角色的人都能“吃飽”;另一方面也看到,市場沒有那么多人才可以允許細分。
現狀
如前面所說,這一年雖然很熱鬧,但還沒有質的飛躍。
從數據的積累或者說成熟度上來看,依然很不樂觀。如果你在這一年做過“征信”、“反欺詐”、“金融風控模型”中的任何一項,你會發現“數到用時方恨少”。
掌握單維度數據的很多,但能夠掌握足夠足夠維度數據的很少。數據散亂在不同的角落,打通起來依然困難。再加上有些不良商家,在數據中摻雜假數據,就使得這一任務雪上加霜。這也是這一領域歐美與國內的***不同。
數據源也如我年初分析的那樣,正在越來越匯聚到幾家***的數據平臺服務提供商那里,只能寄希望于這一動作早日完成,并且他們愿意向第三方開放。
作為擁有很多優質數據源的主體之一—政府,并沒有在數據開放方面走多遠。雖然很多地方都在大張旗鼓地搞大數據交易中心,但多數都是雷聲大雨點小。
在平臺上交易的大多還是第三方數據,而非政府各部門所掌握的數據。未來,這一大塊數據的開放,也將會是推動國內大數據市場成熟的一個很有意義的標志。有比較大的想象空間。
個人認為,大數據進入應用階段,底層基礎的數據以及數據優化的市場,門檻其實很高,壟斷在幾個巨頭手里(不一定只有BAT,還有很多移動互聯網崛起的大數據公司,如Talking Data,極推等),格局已基本確定,跟大多數公司是沒有關系的。一些只掌握了些網上爬來的單維度的數據,如果沒想清楚拿來干什么,還是趁早洗洗睡吧。
在大數據的市場里,到目前沒有發現多少爆發性增長的神話。大數據是一門技術,它跟典型的互聯網項目不同。它不但可以應用到互聯網上,而且可以應用到很多傳統行業上。
應用到互聯網上的情況,多數為企業自身的數據團隊,用自己業務產生的數據,進行數據處理,再反哺回業務本身。目前只有為數不多的第三方數據團隊,為企業來提供此項服務,如GrowthIO。無論是自己用,還是第三方提供,均還未看到爆發性的增長。
應用到傳統行業,就更是慢節奏了。除去行業本身甲方的慢節奏不說,改變一個行業本身就不是短期的事情。就拿很多人喊了一年的所謂“大數據征信“,”大數據風控模型“為例。
首先,改變一個行業的流程,尤其是改變一個幾十年沉淀下來的體系,絕不是一兩年的功夫。如果想要徹底改變”大數據征信“的局面,讓它能成為現實,那么首先要打破原有的FICO建立了幾十年的統計模型體系,與風控形成閉環,并且達到甚至超過原有體系的效果。在此之前,還是現實點吧。不是每一個人都有機會改變世界。
大市場需要大驅動,金融風控的市場很大,很多其他行業的市場也很大,但是需要很長的周期去重新建立一套體系,并不斷使之成熟。否則,不要輕言革命,尤其在金融領域。
大數據在金融領域的今天,還只能唱配角。不可否認,大數據的引入,給金融領域帶來了一股新風。它可以提高金融機構數據的時效性和準確性;同時還可以利用第三方的外部數據來為金融機構有效地提供反欺詐等服務;在催收方面,也可以非常有效地完成失聯修復。但,在金融機構的核心業務貸前審批和貸后管理,仍然以傳統的統計模型為主。
消費金融是個特例,因為消費金融的特殊性,單筆的交易金額小。對于消費金融而言,欺詐風險大于金融風險。
這就是我目前所看到的數據以及數據應用的現狀(當然還是局限在金融行業為主,其他領域沒做過,不了解)。有局部亮點,但還沒有本質的變化,還處于一個量變到質變的過程中。這也是一個行業發展的必然規律。
模式
在大數據的企業里面,大致我看到三種商業模式, 2C,2B,B2B2C。2C見得少,除了印象中的無線廣告平臺,互聯網精準投放平臺,沒想起來其他的案例。目前還在奮戰的企業主要多以2B和B2B2C 為主。
2B和B2B2C看起來一樣,我也曾經考慮過B2B2C是否是一個偽***。但仔細思考過后,覺得還是不一樣。這里面***的區別在于中間那個B在B2C環節中干預的比重。
比如說,我們去年曾經服務過的一個行業的客戶,其反欺詐的部分業務外包給我們,我們成了他為客戶提供2C業務的一部分。這樣我其實是跟它們捆綁在一起,伴隨它的業務增長而增長的。換句話說,如果它得業務呈現一個爆發式的增長,那么我的業務就也有爆發性的增長。
反觀2B業務,大數據企業提供的服務,基本被終結在甲方本身。而甲方再去獨立地為它的2C用戶提供服務。這一模型最典型的就是銀行??梢钥吹剑芏嘁痪€的大數據公司基本都把注意力集中在這里。沒辦法,既然找不到爆發性增長的路子,還是做確定性的市場比較好。
2B***的優點就是確定性,有因必有果。但同時,做2B的市場也有一個***的弊病,在開始的時候不會有像互聯網2C項目那種井噴式爆發增長的可能。這也是在過去的一年里,大數據的發展似乎不“盡如人意”的主要原因。但我認為,這是一個市場良性發展的必然。寶劍鋒自磨礪開,梅花香自苦寒來。
按照以往我做行業的經驗,2B的市場會以3、5、8年的時間周期呈現階段性的大發展。
我們正在經歷一個大的變革,自然也要付出更多的努力。
方向
在過去的一年里,不管2B也好,B2B2C也好,不可否認的是,客戶的數據思維正在建立。雖然市場上很多人分不清楚什么是典型的傳統數據業務,什么是典型的大數據業務。但起碼,現在越來越多的人開始拿數據來說話。
沒有客戶了,要用精準營銷平臺找到用戶,而不是簡單地拿大炮轟蚊子了;有用戶了,要用數據來為用戶進行畫像,更多地了解用戶,為用戶提供更優質的服務,要用數據提高轉化率;在我們下決策之前,也要看看數據統計分析報告了。
總之,我們做業務有了數據的支持,越來越理性了。數據已經滲透到行業的各個環節。
從銀行的主要業務來講,分為“申請審批放款貸后管理催收”五個環節。這五個環節,除了申請和放款兩個操作性動作跟數據無關之外,其余三個核心環節均跟數據有著很強的關聯性。
同樣,保險也是如此。從精準營銷到核保、定價,數據的身影都無處不在。
我們的行業客戶,正在用他們的數據思維,去重構,優化他們的業務。甚至,如果沒有數據的支撐,他們都無法推出很多新的業務。一點不夸張地說,數據科技是他們的未來。
我們正在經歷一個IT到DT的變革時代。數據思維已然形成,數據已經滲透到各個環節,各個角落。數據時代的潮流是不可逆轉的。
人工智能也罷,機器學習也罷,都是這一潮流中的一個個弄潮兒?,F在才只是開始。這一時代的到來絕非曇花一現,而是會持續未來十數年的一次盛宴?;ヂ摼W可能是進入了下半場,可DT時代才剛剛開始。
清楚了這次浪潮的性質以及量級,再重新審視我們今天所做的事情,是否顯得過于急躁了呢?
不管是AI,還是deep learning,任何一項先進的技術,都是為客戶服務的,而不是束之高閣的,孤芳自賞的藝術品。是騾子是馬拉出來溜。好與不好不是科學家說了算,而是客戶說的算,是效果說了算,是為客戶創造的價值說了算!
不用說大數據如何變現,大數據什么什么還看不清楚。今天,我們已經可以利用大數據為我們的客戶解決他們遇到的問題,創造價值。路在腳下,多一些行動,少一些浮躁。
所謂的核心競爭力,就是你在一個正確的方向上比別人走得時間更長,走得更遠。
挑戰
在相當長的一段時間里,數據還是各大數據公司面臨***的難題。沒有足夠維度的數據,沒有足夠數量的數據,沒有足夠質量的數據,做起應用來依然會感覺巧婦難為無米之炊。
目前的大量數據依然把持在幾家巨頭手里。又缺乏一個機制,讓他們放心地將自己的全量優質數據去與別人打通。這就造成了數據的一個個“孤島”,也阻礙了數據的橫向流動。數據只能在內部循環,形成縱向流動。
還有一大部分高質量數據掌握在政府手里或者行業手里。這部分數據的不開放,也制約了數據行業發展的速度。
這一問題的解決就得看行業管理者如何來制定行業規則,促進幾大數據平臺服務提供商的數據開放了。當然,還有未來幾年政府數據的開放進程。
再有一個比較明顯的挑戰就是人才。目前大數據人才的供應顯然跟不上市場的需求,也造成了中短期的人才匱乏的局面。但隨著行業的進一步發展,市場格局的逐漸清晰,這一局面應該在一年后得到緩解。
一方面行業將會重新洗牌,優勝劣汰;另一方面,這種供需的極大不平衡造成的短期人力資源價格的非理性上漲,勢必會造成更多的新人加入到這個隊伍中來。過去的很多行業都是如此,相信大數據也會如此。
***,當然還有諸多技術方面的挑戰。這里我就不啰嗦了。我認為相比前兩個挑戰,這個還會往后排一些;而且,也會有更多更專業的人來闡述。
大數據,正在處于一個量變到質變的過程中。我們所能做的,就是腳踏實地去把眼前的路走好,走扎實;去不斷地在數據應用的道路上踐行,積累經驗,靜靜地等待質變的到來。
把今天的事兒做到***,下一步自然會來到眼前。
關于作者:
中關村老李,真名李曉東,前海航云商大數據業務的掌門人。老李既有二十余年多行業系統集成的經驗,又有十多年開拓新市場新業務的經驗,做事沉穩扎實,對新市場和新業務有著敏銳的感知和深入的洞察力。老李于2012年加入百分點,負責無線業務,經歷了個性化推薦,無線廣告DSP;2015年加入海航,組建大數據業務部,不斷地在大數據領域探索踐行。