普元專家:解決數據質量問題是大數據應用的關鍵
研究稱,整個人類文明所獲得的全部數據量,有90%是最近兩年內產生的。隨著移動互聯大潮的席卷,預計通過網路產生的數據量還將呈幾何級增長。龐大的數據資源蘊藏著無限的寶藏,過去的一年無論是企業、政府還是媒體,都在談論大數據。有人說大數據是黃金、是競爭力,然而在這一切談論的背后卻鮮有人關注數據質量這個最根本的問題。普元數據產品總監王軒認為,大數據處理的關鍵就是解決數據質量問題,規避數據錯誤、保障數據質量才能真正讓企業從大數據應用中獲得利益。
保障數據質量成為大數據發揮價值的先決條件
“企業做數據集成、數據處理的核心價值我認為是兩個方面,首先當然能為企業帶來更多的盈利,其次是規避風險,而實現這兩個核心價值的關鍵就是解決數據質量問題。現在大數據環境也好,傳統數據環境也好,大家面臨很嚴重的問題在哪兒?我們做了很多數據分析和挖掘,這種分析挖掘到底對不對靠什么來衡量?有的企業是基于數據分析作出了一些營銷的趨勢性結論,但如果你的數據本身是錯的,分析出來的結論未必有用。” 普元數據產品總監王軒表示,保證數據質量是大數據為企業帶來價值的先決條件。
《大數據資產:聰明的企業怎樣致勝于數據治理》一書的作者 Tony Fisher 曾提到,如果基本數據不可靠,大多數企業的大數據計劃要么會失敗,要么效果會低于預期。造成上述結果的關鍵原因在于,數據生命周期之中流入了不一致、不準確、不可靠的數據。在數據領域***的一個說法是“更好的數據意味著更好的決策”,這句話從來不假,在當今的大數據時代甚至更為真切。
“在我們接觸的眾多銀行案例中,經常會遇到這種情況,做完一個數據倉庫,客戶信息重名的上萬個,一個人1000多個賬戶,這都是數據質量的問題。為什么會出現這種數據問題呢?數據處理是一個復雜的過程,這其中有很多環節,從前期的數據標準、數據集成到數據處理等等,任何一個環節出錯都有可能導致數據質量問題。其中數據處理是清洗數據和規避數據風險的重要環節,在這個技術領域普元做得很專注,在業內也是領先的。”王軒認為除了現有數據的處理,規避實時數據風險尤為重要的,如何在交易錯誤時即時阻斷數據錯誤是保障數據質量的重要手段。由此普元早就提出大數據平臺產品線的概念,把所有這些環節需要的技術手段都囊括進來,這正是普元正在修煉的‘秘籍’。”
普元大數據產品家族 助力企業大數據淘金
一直以來,國內大型企業主要采用國外的數據處理軟件,隨著技術的扁平化,國內的數據處理軟件技術越來越純熟,價格相對于國外‘大佬’來說更具競爭力。在數據處理市場國產軟件越來越受青睞,一方面原因是企業成本,一方面則是信息安全。
“本土化的軟件更適合國內企業的業務需求,自主掌握知識產權的產品對企業來說安全性更高,IT成本極大降低的同時安全性又得到了提高,企業何樂而不為。”王軒表示。
普元從2010年開始涉足大數據領域, “普元數據處理軟件平臺領先的技術和方法論可以從根本幫助用戶解決數據質量的問題,普元的復雜事件處理平臺則幫助用戶實時規避數據風險,普元完備的大數據產品家族提供從咨詢、數據集成、數據治理到可視化的‘一站式’服務更是解除了企業大數據應用的后顧之憂。”王軒指出普元大數據產品已具備豐富的功能。
目前普元的大數據產品家族分為四大平臺,分別是智慧數據應用平臺、復雜事件處理平臺、數據質量平臺和元數據管理平臺。“普元的大數據產品線在業內是***和領先的,這一點并非空穴來風。我們的產品在業內特別是金融行業有多年的積淀,普元的數據平臺基礎軟件已經應用于國家開發銀行、中信銀行、北京銀行、上海銀行等國內金融行業的重點企業,普元數據線軟件產品也受到用戶的廣泛認可。”王軒強調。
談到普元大數據產品在未來的發展方向時,王軒表示“普元的大數據產品家族是非常豐滿的,未來普元會持續加大在大數據研發方面的投入,繼續完善和擴充大數據產品,以適應新技術時代企業不斷變化的數據應用需求。”