大數據大熱知易行難 企業必須充分積累各類數據
日前,國務院印發《促進大數據發展行動綱要》(下稱《綱要》)。《綱要》指出,2018年底前,建成國家政府數據統一開放平臺。2020年底前,逐步實現信用、交通、醫療、衛生、就業、社保、地理、文化、教育、科技、資源、農業、環境、安監、金融、質量、統計、氣象、海洋、企業登記監管等民生保障服務相關領域的政府數據集向社會開放。同時,強化中央財政資金引導,集中力量支持大數據核心關鍵技術攻關、產業鏈構建、重大應用示范和公共服務平臺建設等。
海通證券表示,此次《綱要》的下發,促進政府數據開放、共享有望使得各行各業真正迎來大數據時代。同時,大數據全產業鏈的培育有望搭建中國大數據新生態,而大數據在新的垂直領域的應用將助力商業模式和變現渠道的創新和探索,有望重構產業鏈的價值體系。
在打破“信息孤島”實現數據互聯互通的道路上,數據的采集是需要突破的第一道關卡。北京騰云天下科技有限公司首席金融行業專家鮑忠鐵對《第一財經日報》記者表示,數據采集面臨數據現有存在形式的非電子化和分散度較廣兩大難題。
“目前,公共機構大量的數據還是以紙質化的形式存在著,特別是醫療數據、教育數據和農業數據。”鮑忠鐵表示,未來如何將這些存留在紙張里的數據電子化將面臨較大的挑戰。
數據想要集中在統一平臺上,就要實現數據的集中,但是目前大量的數據分散在省、市、鄉、鎮等不同的政府層級中,并不完全集中在國家層面。“數據不集中直接影響對數據背后規模發現的程度。”鮑忠鐵進一步告訴《第一財經日報》,數據分散之外,在集中的過程中,數據格式不統一也是需要攻克的難題。例如,同樣一條信息,A鄉用6個數據來詮釋,B鄉用10個數據詮釋,而C鄉卻用12個。現在距離2018年還有三年的時間,想要在三年時間做到數據標準和格式的統一化并非易事。
任何事件的發展都需要循序漸進。從政府數據的開放來看,目前政府數據可以分為三類,可以向公眾公開的數據、不宜公開的敏感數據和不能公開的國家機密數據。海通證券表示,未來數據開放應該遵循分級、分層、分類逐步開放的步驟。短期來看,涉及到民生的交通、醫療、信用、社保等行業有望較早實現開放。
前海征信總經理邱寒對《第一財經日報》記者表示,大數據要產生價值存在諸多關鍵點,積累和整合就是其中之一。“大數據之所以不同于以往的常規數據分析,其核心在其大。只有數據夠大,大到突破一定的臨界點,才有可能從量變轉化為質變。”邱寒表示,大包含幾層意思,第一,數據的維度夠豐富;第二,數據的頻度夠高;第三,數據的時間跨度夠長。而要實現這些,企業必須充分積累各類數據。