Informatica首席顧問:如何實現大數據、主數據雙贏
原創8月16日,2012 Informatica全球巡展研討會在北京舉行。此次大會以“智匯數據,集聚價值”為主題,旨在借助主數據管理,幫助企業遠離高成本和高風險。
Informatica大中國區首席產品顧問但彬與在場觀眾分享了“如何借助大數據來提升客戶的價值,實現大數據、主數據雙贏”。
但彬提出,現在媒體在大數據時代不僅僅是傳統的數據交易和簡單的分析數據,各種各樣的信息源都可能成為信息輸入口。但是如何確保數據的準確性和唯一性?現場用一個虛擬用戶在Informatica客戶管理系統中演示了如何識別一個客戶。
主數據橫向核心能力側重在哪幾個方面?一是核心主數據要解決多域問題,二是針對各個行業的解決方案,三是不斷地跟云和大數據領域的整合。
詳細報道請看:2012 Informatica 現場直播 全球巡展 北京站現場直播
以下是文字速記:
但彬:
各位下午好!
今天要給大家分享的是,如果借助大數據來提升客戶的價值,叫大數據也好,主數據也好,我們都是希望通過更高的質量來提高客戶的價值,來使客戶從中獲益,也使我們自己的業務從中得到發展。
前面托尼·楊跟我們分享了一個故事,說一家銀行收購另一家銀行,這兩家銀行合并給我們帶來一些什么樣的苦惱呢?我們看這樣的情況,現在媒體在大數據時代已經不僅僅是傳統的交易數據和簡單的分析性數據,我們看到各種各樣的信息源都可能成為我們信息的輸入口,包括INFABANK有網上銀行,也有微博,他可以通過微博表達一個什么信息呢?他說了一句話表達了兩種信息,一是我的私人信息被賣用。當他給我們客服人員打電話,客服人員告訴他你的信用卡還有多少,他覺得很詫異。同時他向我們客服人員進行投訴的時候,客服人員并不知道他投訴的誰,客服人員在三十分鐘得到各種切換,使他得不到滿意的答復,他很抓狂。實際上我們經常出現這種情況,可能還不是在銀行合并或者企業重組的狀態下,其實在現有的生產環境中,包括業務系統之間的相互獨立,已經足以造成客戶或者業務層面的問題。
開始提到他講的故事是這樣合并的情況。那解決客戶生氣的時候怎么解決呢?我們要找到相關的公司,由INFABANK給我們提供解決方案,第一步要進行查找到相關的信息,之間的關聯關系,找到我們的信息在哪里,同時發現其中哪些信息受到保護,同時識別出開始看到這個抓狂的先生,我們管他叫王嘉明,到底是哪一個王嘉明,可能在銀行里有很多王嘉明。第三個把所有真正的王嘉明信息進行相關的重組,獲得全方位的360度的視圖。另一方面,我們需要把他證件的信息、信用卡的信息進行相關的保護。
現在來看看發現,如何才能發現一個企業信息。開始提到INFABANK和銀行進行合并,合并以后帶來的問題是什么呢?他們的業務只是放到了一起,但是所謂的合并和整合是兩個概念。我們可以把兩個東西搬在一起,但怎么使他們的業務有機運行在一起,這不是一天兩天能解決的,如何縮短這樣合并的進程,使得客戶混淆或者不滿降到最低,如果我們合并變成最低風險,就不是1+1,而是1+1再減0.5的結果。這樣我們知道兩家銀行的信息可以找到互相關聯的關系,同時一家銀行為主,一家銀行為輔,開始在第一場演示時看到,拿過來的信息全部是沒有關聯的,就跟現在這樣,這是關聯以后,關聯以前并沒有任何聯系,并不知道這個客戶和這個客戶兩張表有沒有來源,有沒有關系。這個表里的客戶和客戶信息能不能關聯,關聯度有多少。我們其中發現這個功能,可以自動識別出之間隱含的關聯關系,這樣可以保證信息的參照完整性。
第二方面,我們要識別,開始談到了王嘉明,當然也開始提到像王嘉明這樣的名字,在銀行中可能找出五十個甚至一百個。但是我們可以認為這五十個是一個人嗎?為了不出錯,我們一般情況下會分成五十個人,因為我們不用對一個客戶負責,但是銀行第一要務保證對賬戶的準確,知道這個賬戶是某一個人是不完善的,我們需要這個人到底擁有哪些產品,甚至他除了我們銀行內的產品以外,還有哪些通訊工具是可以用的,他有哪些方式可以對我們進行交互,他微博賬戶是什么,要不然在我們銀行微博里發表評論的時候,我們都不知道這個人突然冒出來,但是也并不知道到底有多少人關注這個人,這個人的影響力有多少,所以要了解一個人,他的信息相當全面才能定位一個人。同時定位這個人和其他叫王嘉明的人是一個人還是不是一個人,是一個人一定要合在一起,不是一個人一定要切開,才能全方位了解他,這就是識別的過程。
我們來看識別簡單的過程,我們這里有一個演示,他講了一個故事,比如這時候看到整個畫面里面,在右邊是偷聽的王嘉明,他很生氣,這也是他抱怨給銀行看到他在抱怨業務。同時在生活中又是另外一個人,這個人站在走廊的盡頭,他在干什么?這個人是不是他呢?也會發現在生活中有一段視頻,他從一個車前跑過來,我們有兩種認為,一種認為當車開了他在躲車。生活中我們認識一個人也是從側面認識的。我們從另外一個角度去看他在干什么呢?他高過去,沖著一個戴禮貌的人,把他的包奪了過來。這個時候我們覺得王嘉明是他嗎?可能不是他,他是個文質彬彬的人,他不太像一個劫匪,不可能奪別人的包。這個時候我們了解王嘉明嗎?你會發現各個方面的信息不能串在一起的時候,你快神經分裂了。經過全方位的看,我們認識一個真實的王嘉明,上面有一個扳手掉下來,他跑過去救了他。其實我們的微博也是這樣一個狀況,所有人都在發表意見,每個人從自己的角度發表意見,他認識這樣一個事件是否完整,我們認識王嘉明也是這樣,我們可能克服系統知道他是愿意抱怨的人,但是網上銀行認為他是購物達人,但是微博里認為他是發言狂人,只有把這些信息組合在一起,他才是完整的王嘉明。
我們看了這段故事,幫助我們了解認識一個人應該是多方面的,通過各種信息的發現、識別和關聯,全方位認識一個人。我給大家演示一下,我作為INFABANK的一個雇員,我如何通過一個Informatica客戶管理系統幫助我們識別一個客戶。
這是我們看到的Informatica客戶信息登錄界面,我以一個客戶專員的角度,要了解一個客戶的消息,當他有投訴的時候,我應該怎么做呢?我是以一個身份登錄,我這個身份設置的比較特別,他更加關注客戶在網絡媒體的評論。我剛進來的時候,會看到收到一條信息,這個信息說王嘉明先生通過微博表達對客服的不滿,他的這個不滿做了一個流程,因為收到信息以后,當我們的系統整合來自微博的信息以后,自動推送到我這個崗位上,我要處理這些不滿,或者認為這些不滿是真實還是不是真實,要跟客戶解釋,可以處理它,可以不處理它。但我如果要處理,我要處理客服不滿這件事,我看到這個人叫王嘉明,我去查一下我的系統里這個王嘉明叫什么呢?因為大家看到他第一眼的時候他叫王嘉明,有的時候客服只是接了一個電話說我叫王嘉明,他就記住這條信息。我可以對他進行客服信息查詢,現在我打一個查詢,王嘉明,然后進行查詢。在系統中看到確實存在這樣一個客戶叫王嘉明,我們打開詳細信息,我們看到王嘉明生于1980年7月1日,雖然是80后,但是現在已經進入30歲了。我們可以看到他的證件信息,在對于一個客服來說是不應該的,對于后臺系統來說可能看的見,這是我們下一步要改造的。
我們看這些客戶有什么樣的特征,他的信息注冊在成都,這個人并沒有采用我過多的產品,他只是用了一個儲蓄賬戶的一張信用卡,他整個客戶評級,我們內部有評級,得數不高,3分,同時看到他給我發的一個抱怨,查出這個東西并沒有這個賬戶信息。同時反過來,他倒是有一個FaceBook,從這個來看這個人并不是十分受關注的人,他的關注度只有277,并不是像粉絲很海量的,像有的明星可能就幾十萬。再看看他的家庭關系會是什么樣子,另外開始提到了,我解決問題的時候,最后是把我妻子的電話解決了。但是從這個信息來,王嘉明的家庭信息中并沒有他妻子的信息,只有他賬戶信息和相關FaceBook的狀態,我們認為這個可能不是,有可能是錄入員錄錯了。#p#
我們做一次蘑菇查詢,看一下跟王嘉明相似的人到底有多少。我們看到在這個系統里面,湊巧有兩個,一個叫王嘉明,一個叫汪嘉明。從字來看只有一個字相似,他們的生日一個是7月8,一個是8月7,我們先看一下這個人的信息是什么樣子,從上面來看,有大量的負債,三千可能是隨便一個數,可能是三千萬,他有很高的資產,相對來說他的信息很全面。他有負債的原因是什么?他有一個質押貸款的服務,同時他確實有一個信用卡賬戶。這個人在微博狀態是什么樣的?也發現他是很愛發言的人,我們用五百表示他的發言數是比較高的,可能在一段時間內發了五百條。他的被關注數也是很高,有上千人關注他的行為,他關注的人相對較低。這個人可能在輿論上可以帶來很大的影響。同時我們也評估了他投訴事態的嚴重性。從他自己的信息來,我們發現這個王嘉明是不是開始那個人呢?我們是不是要去查一下跟他相似的人是不是可以進行對比一下,我們可以去察看這樣的重復數據。這時候會看到這里面有兩個人,我們顯示一下這兩個人哪些信息是相似的。從基本信息來看,系統認為他們的名字,出生日期和證件號碼比較相似,所以相似度比較高,97分。在銀行確認里面,認為他基本可以判定為一個人,可能有些是筆錄的錯誤。
同時去看一下他的信息,會發現每個其他的信息都是來自于銀行的主觀信息,而客觀信息是比較相似的,可以對他進行合并。合并的時候,我們系統會跟你推薦說把兩個人合成一個人,一個人叫王嘉明,一個叫汪嘉明,系統會根據不同權重和可信度,同時加上日期來進行評價。比如出生日期,他們會看到他更傾向于8月7日的日期,他如何得出8月7日更好呢?其實有一個評分值,后臺會計算這個生日可信度更高一些。當然你可以不選用這個值,甚至可以說7月8日、8月7日都是錯的,因為這時候當我找到這個客戶以后,我欣喜若狂,我會給王嘉明去一個電話,說王先生你好,剛開始你抱怨的問題,因為系統的原因和一些原因,我們有些信息認為有沖突,我們希望你有一個確認,未來可以更好的提供服務,我想你可能會得到一個真正的信息在這個地方。我們先不進行調整,我們可以去進行合并。合并以后,看到這個信息從地址信息都合在一起了。可以看到王嘉明有一個儲蓄賬戶,汪嘉明有一個貸款賬戶。其實我們可以從另外一種方式看到他更完善的信息。我們可以看到把兩個王嘉明和汪嘉明都合在一起了,他們聯系方式和產品都合在一起了,同時在王嘉明家庭信息上面開始漏了一個信息,發現有一個王愛麗,可能是他的妻子。同時我們發現一個意外,他的妻子是一個企業的老板,他自己有一間公司,她這間公司同時是INFABANK的客戶,這家公司也有我們這個銀行的產品。從這方面可以鎖定王嘉明確實是我們的客戶,有很大的業務往來。同時我們可以把兩個家庭進行合并,合并的過程是相似的,簡單的合并就行了。合并以后,這個家庭叫什么名字,新的家庭住址愿意用哪個都可以填上去。合并以后的信息是什么樣的,這樣的信息已經確認了,放大一點可以看到兩條信息的關系還存在,可以把這個關系刪除掉。
開始我做這些動作,就是客戶經理日常要維護一個重要客戶的過程。可能他的維護過程并不是一定要到業務系統里提請交易,可能在IPAD上就可以做相關的事情。如果繼續深挖這樣的信息,會發現還有更有價值的信息出來。比如開始看到的王愛麗,既有一間公司,同時有一個信托賬戶。信托賬戶上面有兩個姓王的人,一個叫王愛華,一個叫王大偉,這個人跟她有共用賬戶,其實我們跟王先生確認的時候,他說這兩個人是我們的孩子,一個兒子,一個女兒,他們跟媽媽的關系比較好。我們可以把王大偉放到這個家庭里面來,他會問你,這兩個人是什么關系,是家庭的成員關系,我們可以把它建立起來。
開始我們提到了王嘉明和他的愛人,他們兩者是夫妻關系,我們也可以把他們之間建立一個關系。這個時候會發現關系有很多種,可以選擇夫妻關系。這時候我們會發現整個一張完善的客戶信息的視圖就幫我們構建起來了,我們認識這個王嘉明的時候,不再是只有儲蓄賬戶的普通人,不會說簡單地有抱怨,你會發現他的抱怨來自實力雄厚的客戶,他會有很大的脾氣。
這個演示只是簡單地演示到這里。像日常處理中,會在演示完成以后,就可以把這個信息看完以后,可以處理開始看到的那次投訴,會說這個投訴問題已經解決,我們已經把相關的信息收集全,并且得到客戶的一個認同,這是我們常見的客戶處理的過程。大家可以看到客戶信息一致的問題、不一致的問題經常會困擾我們的客戶,特別是面向虛擬的客戶就是這樣的,因為服務就是我們的一個重點。
在開始談到整個平臺,我們都是在Informatica主數據平臺的基礎上,剛開始談主數據就是一個很空的殼子,它完全可以落實成一個一個應用,我們在主數據基礎上發展面向27個行業不同的解決方案,100家客戶都在采用我們的解決方案,有的解決客戶的信息一致性的問題,有些是幫助解決生產過程中的產品資料重復的問題,像國內的客戶,這兩類問題都會遇到。有的會混淆我是不是重復購買,當我需要用替代品的時候,我不知道倉庫里哪個產品可以用,如果有人故意扭曲把變壓器寫成另外的東西,或者寫成英文,看的還是變壓器,但是兩者去找的時候是找不到的。這些信息都會帶來一些問題。同時在生產過程中有人會故意混淆去做,因為提取的速度很慢,如何屏蔽或者杜絕這些現象,幫助我們業務運行更加流暢,都是需要一些解決方案。在我們的客戶50%以上都是全球五百強的客戶,同時我們的解決方案也在購置在不同的解決方案里應用。在解決功能的時候,Informatica十分注重產品的性能,我們覺得要做大量的定制和開發的過程,就可以快速讓人體會到數據管理和客戶信息一致性帶來的好處。
Informatica主數據解決方案主要從兩個方向發展,一是解決主數據的核心能力。另一方面解決平臺上面的整合能力。這兩者能力,對于我們來說可以幫助客戶達成怎樣業務的一些優勢呢?一方面解決不同領域的專業主數據的問題。在主數據里,大家會談到關于主題的概念,比如剛開始談到客戶,就是一類主數據,一類主題,談到產品也是一個主題,談到組織機構也是一個常見的主題。同時在行業里面也有較大的差異性,比如說面向服務的,可能就會發現以客戶為主要目標,面向生產就以生產保障為主要目標。同時在Informatica解決方案當中,除了主數據之外,外圍有很多產品幫助他獲得和收集信息,可以以各種形式獲得各種來源的信息,來轉換、發現等等處理信息。
同時從線下來看,會很快適應你的業務,這就是我們談到的兩個方面,托尼·楊談到的,一方面提升價格,另一方面壓縮成本。兩者的差、兩者的除才是真正企業數據的價值,如果提高企業數據的價值,通過一個提升、一個下壓來實現的。
在主數據平臺上開始談到核心方面,一方面就是平臺方面。平臺方面有哪些支撐?一方面看到數據質量方面,開始談到可能一個叫王嘉明,一個叫汪嘉明,在我們看來,這是兩個完全不一樣的。但是在日常輸入中,不管客服還是柜臺都會變成一種常見的錯誤,那么如何識別這種錯誤,以至于解決客戶之間一致性的問題,這就是常見的問題。其實在數據領域還包括大量的問題。舉一個例子,同時數據集成可以幫助我們快速的,比如不同的銀行,不同的部門,把數據收到主數據當中,B2B的數據整合,比如來自微博的信息,完全不同于日常的信息,完全跟主數據集成。可能來自其他行業,比如醫療保險行業,可能來自于醫院的一些信息,這些都可以利用B2B的交換平臺,實現數據之間對接和交換。同時我們緊密地跟云運用集成,比如跟FaceBook,同時我們的主數據平臺也可以實現在云應用之間互相集成、互相調用。
開始談到的主數據橫向核心能力側重在哪幾個方面,一是核心主數據首先要解決Informatica所謂的多域問題,如何去適應不同行業、不同主題領域解決方案,比如說可以去做一百個或者一千個,但是總是會有第一千零一個出現,所以平臺本身的適應性很重要。所以主數據平臺最重要的特征是有多域的支撐點,我們管它叫多主題的核心。同時針對各個行業有解決方案,比如針對醫療行業的客戶關懷信息的管理,比如說針對醫療行業有電子化的局域信息管理,在上面都定制可重復利用的資產,可以快速實現這種信息的部署和實現。在全球還有一大類的客戶就是大量在醫療領域行業制造的客戶,包括我們想到的強生等等都是我們的大客戶。同時在大的趨勢上面不斷地發生跟云和大數據領域的整合,不斷從其他領域獲得數據,從客戶端層面不斷支持移動終端,比如現在的版本可以支持在IPAD上應用,可以跟Google地圖上的應用,這些都是新的版本面向新的信用的特點。
前面簡單介紹一下Informatica的平臺。同時看到一個故事和一個場景,大家可能對Informatica主數據解決方案,特別是針對客戶領域的解決方案有一個大致的理解。但是我們回過頭來看,王嘉明好像不是太滿意,因為他認為我的問題只是解決了一半,說你已經知道我是誰了,并且知道我很重要,已經開始給我打電話道歉等等一系列,讓他覺得有一定的放松。但是他認為在信息保護領域還是得不到滿意的答復,因為他認為我的信息還是能被看到。所以解決這些問題,我們下一步就要解決保護的問題,有關如何保護客戶信息,使相關人員對的人看到對的信息,使這個信息更好發揮價值,同時能使企業資產得到保護,會交由我們專門負責數據安全的專員,INFABANK信息安全專員孫大山同志來介紹,謝謝大家。