中國大地保險數據管理應用中心大數據應用平臺案例分析
原創【51CTO.com原創稿件】近年來,大數據、云計算、人工智能和區塊鏈等技術如雨后春筍般涌現,以眾安為代表的互聯網保險公司橫空出世,BATJ等互聯網公司紛紛涉足保險業,使得市場競爭不斷加劇。與此同時,移動互聯時代下,保險客戶的行為以及保險營銷生態都發生了巨大變化。
保險業轉型迫在眉睫
中國保險行業傳統發展模式面臨發展瓶頸,傳統保險企業的轉型升級迫在眉睫。在這樣的一個轉型窗口期,誰先抓住時代、抓住客戶,誰就能獲得更好的生存和發展空間,否則將面臨出局的風險。保險業要想在強敵環伺的移動互聯網時代生存和發展,必須開發更為合適的產品,提供更為優質貼心的服務,以滿足客戶的需求。而傳統的營銷、承保、理賠、后援服務等,都面臨新時代的挑戰,需要科技手段為其全面賦能。
2017年底,在“科技驅動的客戶綜合經營”戰略導向下,中國大地保險創新孵化中心應運而生,該中心旨在落實公司科技驅動的戰略目標,從而在變革時期承接對創新業務的持續探索。據悉,中國大地保險創新孵化中心的職能大致分為四大板塊:即行業研究,創新管理,金融科技,大數據及人工智能應用。
中國大地保險大數據業務模型實例
在大數據及人工智能應用領域,中國大地保險創新孵化中心項下的數據管理應用中心將大數據技術應用于營銷獲客、風險控制、精準營銷等領域,輔助決策,為業務全面賦能。
數據管理應用中心列舉了三類業務模型實例:
- 1、數據管理應用中心構建了家用車續保預測模型,在車輛保險到期前進行續保預測,指導銷售人員有針對性的開展續保工作;
- 2、開發了基于SNA社交網絡的理賠反欺詐模型,用于公司車險理賠反欺詐管理,已成功追償多筆賠款;
- 3、開發了銷售人員產能分析模型,用于銷售人員分群管理,幫助業務線更好地進行銷售人員管理。
保險業的數據特點及需求
與互聯網大數據海量、高頻、數據復雜度高的特點不同,保險業的數據以保險交易數據為主,例如報價、承保、繳費、理賠等數據,以官網、公眾號、App等平臺獲取的客戶行為數據為輔,這些數據的特點是結構化、準確、低頻。
保險業的數據來自于業務的各個環節,很容易形成數據孤島,因此保險企業做大數據分析時對數據分析技術和工具的要求相對較高。首先,在數據整合和清洗環節,數據的整合工作需要跨越多個平臺,涉及多種數據類型,需要高兼容性的數據處理工具高效地將各類數據集成起來。其次,當多個業務環節的數據被整合在一起之后,海量的金融數據會變得高維、稀疏,因此在數據探索、建模階段,傳統的基于單臺服務器的數據分析工具難以滿足保險行業超高量級的分析建模需求,需要具有大規模分布式處理能力的數據分析工具進行支撐。
保險大數據架構及方案的選擇
Hadoop生態系統具有高可靠性、高容錯性、高可拓展性、高效性以及單位計算能力低成本的特點,通過數據多拷貝、冗余存儲的方式,能夠滿足金融行業對數據處理工具高可靠性和高容錯性的要求。
- 在擴展性方面,傳統的數據處理工具難以實現處理能力隨著數據量的增長而線性拓展,Hadoop生態系統在線性擴展方面有較強的優勢,能夠充分滿足企業業務增長的需求。
- 在高效性方面,作為并行分布式計算平臺,Hadoop采用分布式存儲和分布式處理兩大核心技術,能夠高效地處理PB級數據。
- 在單位計算能力的成本方面,Hadoop能夠運行在使用Linux操作系統的X86服務器上,硬件成本更低,結合其高可拓展性的優勢,能夠大大降低企業大規模數據處理的成本。
Cloudera是Hadoop生態系統中領先的大數據解決方案供應商,也是全球知名的企業級數據管理和數據分析平臺提供商。Cloudera的CDH是成熟、穩定的Hadoop商業發布版本之一,擁有大量企業級大數據部署案例,并且能夠提供專業、全面的技術支持服務。
因此,經過多個方面的綜合考量,大地保險數據管理應用中心決定使用Hadoop平臺作為整體架構,選擇Cloudera成為其合作伙伴,搭建大數據平臺,將大數據技術應用到更加水平,為企業業務全面賦能。
中國大地保險大數據平臺部署策略
在軟件方面,中國大地保險已經于2017年引入Cloudera的全套大數據解決方案,并在此基礎上進行了一定的定制化改造和封裝,使其在應用中更貼合大地保險的業務需求。目前中國大地保險的大數據集群已部署20+臺服務器,并計劃在2019年將集群擴充到50+臺。
在實時數據處理方面,中國大地保險采用Flume+Kafka+Spark streaming+Hbase的技術方案,實現數據從前端的采集、傳遞到中臺的計算、展示,然后到后臺進行存儲。在離線大批量數據處理方面,中國大地保險采用Sqoop+Spark+Hive/Parquet的技術組合,實現數據跨平臺同步、大批量處理和存儲。在OLAP(On-Line Analysis Processing)在線分析方面,由于Impala的查詢性能強悍,因此中國大地保險使用Impala進行數據的快速理解、分析。在數據建模方面,使用Spark中的MLlib來進行大規模數據的分布式機器學習、建模。
目前,中國大地保險已明確了“線上化、數字化、智能化”的年度工作目標,將數字化轉型列入公司的戰略層面,圍繞“移動、云、大數據”等新技術,逐步提升企業的數字化水平。大數據及人工智能應用平臺只是大地保險戰略下的創新項目之一,在構建數據分析平臺的基礎之上,大地保險將實現領先的大數據分析能力,以科技創新為核心驅動力,向構建信息共享生態圈這一目標繼續前行。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】