大數據共享交易平臺:欲練神功,必先自宮!
大數據交易平臺發展迅猛
大數據成為創新經濟的引擎,基于大數據的產業異常活躍,各地政府都把大數據當做經濟轉型的重點,也把大數據作為“彎道取直”,實現后發趕超,獲得跨越式發展的機會。于是,很多地方聯合企業主導的大數據產業園,大數據交易中心紛紛成立:
面對各地蓬勃發展的大數據交易中心,大家都很謙虛,都在說探索,那么什么樣的數據共享交易機制才有利于數據的流動呢?
數據企業對大數據交易平臺并不感冒
接觸過不少大數據企業,通常都會問負責人同一個問題:你們的數據會通過數據交易中心提供服務嗎?得到的回答也幾乎是一致的:怎么可能?憑什么?
聽到這種回答,我們也不禁要問:為什么?
在商品經濟時代,商品交易平臺,無論是線下的大賣場模式(國美、蘇寧),還是線上的商城模式(天貓、京東)都加速了商品的流通,對經濟發展起到了巨大的推動作用,即使收取很高的費用,商家也爭先積極入駐商品交易平臺,平臺也取得了巨大成功。
大數據交易中心目標同樣是鏈接供需雙方,加速數據流通,園區也建了,優惠政策也給了,并且還免費進駐,為什么數據企業并不買賬?
數據企業不敢把數據拿出來共享交易的擔心有兩方面:
1.數據合規性。什么樣的數據可以共享和交易?數據需要處理到何種程度才可以共享和交易?數據拿出來會不會被投訴或者處罰?這些問題困擾著數據擁有者,謹慎的數據擁有者為了規避風險,不求有功,但求無過,索性就不拿出來。
2.數據安全和權益保障。數據在共享交易過程中,存在被第三方復制、留存,轉賣等風險,數據資產權益無法得到保障,數據共享可能就是在為他人做嫁衣,收益風險比太低,不值得把數據拿出來共享交易。
數據商品具有特殊性
通常的商品,不管是實物商品還是虛擬物品,都有一個明確的所有權約束,獲得所有權,就能唯一擁有商品,享用商品帶來的價值。商品交易和交換,是商品所有權的轉移的過程,在所有權轉移之前,任何一方觀看、托管甚至試用都不會真正擁有商品,這些過程也不會對商品提供者造成實質性利益損害。
相對于普通商品,數據具有其特殊性:
1.無唯一性,沒有明確的所有權約束。普通商品具有唯一性,同一時間只能有一個所有者,所有權與唯一性是相關聯的。數據商品不具備唯一性,可以同時交易給多個對象,也就沒有了傳統所有權的概念。
2.看過即擁有。傳統商品的所有權都有一個顯式的、公認的證明,比如房產證、股票賬戶,交易的安全就是順利保障所有權的轉移。數據商品沒有了傳統所有權的概念,交易流程少了一個關鍵的卡位點。而擁有數據商品也更為簡單,成本更低,看過即擁有了數據商品,就能獲得效用。
3.數據復制的完全無差異性。普通商品也存在復制和盜版,但復制品和盜版在效用上是與原商品有著巨大差別的,比如仿制的汽車不如原廠汽車質量好,復印的畫不如原版畫價值高……,而數據產品的復制具有完全無差異性,在效用上也沒有差異。
數據商品如此簡單就可以擁有,如此簡單就可以被復制,應該用什么樣的方式來保護流通呢?
傳統交易平臺成為數據交易威脅
我們來看一下當前數據交易中心的交易模式:
•托管交易模式
數據機構將需要交易的數據托管到大數據交易中心,購買者與大數據中心進行數據交易。
•聚合式交易
數據聚合中心通過API接口將數據業務機構鏈接起來,業務機構無需事先將數據上報給中心,數據由機構自己管理。當某個主體需要查詢數據時,通過中心與數據機構實時交互,有數據的機構回應信息,由中心統一返回給查詢機構。
上述傳統的交易模式,針對數據安全和權益保障,交易中心會舉出一系列安全措施和保護方案,如機房先進,多地存儲,多層防護,人員分權等等,表明數據在交易中心很安全,不會被其他人竊取 ,多么厲害的黑客也很難攻入。這些措施都是必要的,但這些措施制設計時,都是針對其他第三方,對于中心自身是不設防的,中心有能力、也有機會留存交易數據,也就是中心自然變成了數據的擁有者,可以對數據做任何處理,包括轉賣,再加工,再增值……。
交易平臺往往都是把自身作為權威、可信第三方,表明自己不愿也沒有動力去留存數據。但無法做和不愿做是兩個概念,無法做是想做但做不到,不愿做是有能力做但沒去做,一個是不具威脅,一個是具有潛在的威脅。
因此,從某種意義上講,數據交易中心形成了對交易雙方的潛在威脅,也成為數據交易的一個障礙。
怎樣消除中心的潛在威脅?
需要從機制上保障交易中心沒有機會復制、留存數據,從不愿做變成無法做,讓交易雙方放心,具體要做到:
1.對購買者放心:
•數據產品合法化,規范化,可預期。
•交易要保密。信息查詢或者購買行為本身就是隱私,不能被廣播、被無關機構獲知,僅數據提供方知曉。
•交易要精準。一旦發起交易,必定成功。
•交易有保障。交易行為有記錄,可查詢,可申訴
2.對提供者放心:
•數據由提供者存儲和管理,誰的數據誰控制。
•交易過程中,數據僅能被購買者獲得,其他任何第三方,包括平臺,也無法獲取數據。
•數據購買者無法在平臺上將購買的數據再次交易。
•購買者的購買需求會準確傳達,不會被平臺過濾和轉向。
•交易有保障。交易行為有記錄,可查詢,可申訴。
實現放心的平臺,需要強有力的技術支撐和嚴密的運行機制:
1.正確運用加密技術
一個系統不是用了加密技術就代表了安全,更重的是是否能正確使用密碼技術,密碼技術的正確使用包括兩個方面:
•密碼算法的正確使用。單獨一種密碼算法很難有效保證整個系統甚至某個應用功能的安全性,需要對多種算法進行有效組合,比如身份確認可以使用非對稱加密,不可逆可以采用HASH算法,大數據量加密采用對稱加密,不可抵賴和篡改使用數字簽名,定向加密采用數字信封等等。即使使用,不合理的組合也會導致漏洞。
•流程的正確使用。完成整個業務的安全必須在各個流程中正確使用加密技術,在數據共享流程中,至少要包括:
»密文索引
»密碼查詢
»密文獲取。
正確加密技術的使用目標是每一筆交易都不可抵賴,都可以追蹤,中心平臺無法獲取數據內容。
2.引入區塊鏈技術
區塊鏈是一種分布式的、完整的、不可篡改的、多方參與和監督的記錄方式。將數據交換使用區塊鏈記錄,可以讓所有機構公平參與,中心平臺的操作也變為透明和可監督,可以讓中心成為隨時可監督,可拋棄、可替換的服務者,每個參與者也可自成中心。
弱化中心功能,讓中心成為服務者而不是控制者,這是區塊鏈技術最大的貢獻。
3.開放與開源機制
無論多么完善、多么NB的機制和體系,都擋不住實現過程中的小“技巧”(漏洞或者后門)。表面上說的再好,最后的實現是黑盒,還是無法用參與者放心,因此系統進行了協議開放和代碼開源。
•協議開放。系統對交互的協議和數據格式公開,參與者可以自行技術實現相關組件加入體系,確保自身數據的安全可控。
•代碼開源。系統為參與者寫好了數據接入模塊,源代碼公開,讓用戶看的清清楚楚,也證明系統的清白。
敢于協議開放和代碼開源,本身就證明系統的透明和安全。
4.嚴謹的流程設計
機構0向交易平臺密文公布共享數據的索引。密文為單向散列算法,只根據密文無法推導出原文,誰也不知道機構公布為了什么!信息沒有泄露風險。
•機構1將要查詢的用戶ID使用同樣加密算法加密后,在加密索引中查詢。加密索引通過圖塊鏈實現,任何人都可以下載查詢,因此查詢動作和查詢信息都不會泄露給其他機構。
•機構1向可以提供數據的機構4和機構6發送數據獲取請求。請求只發送給能夠提供數據的機構。
•機構4和機構6收到請求后返回數據,數據使用機構1的公鑰加密加密后傳輸給機構1。收到請求的機構必須應答,因為已經在索引中進行了聲明,無法抵賴。
•機構1分別收到機構4和機構6發來的加密數據,使用自己的私鑰解密數據。使用查詢機構的公鑰加密,只有查詢機構能夠解開,其他任何第三方無法解密。
去中心功能,做服務型平臺
保護交易對方的權益,交易中心不僅僅是不能侵害交易方權益,同時也須避免對交易方的權益形成威脅。
對于當前數據交易中遇到的數據合規性問題,交易中心不是等待問題自然解決,不是袖手旁觀,不是看著數據企業孤獨的奮斗,而是應該利用自身的優勢,與數據企業一同開發數據產品,制定數據規范,共同促進,共同承擔。
對于數據交易中數據權益保障問題,把交易雙方的權益放在第一位是交易平臺的重中之重,交易中心除了保障數據不被其他第三方侵害,也不要讓自己成為數據的潛在威脅者,需要放棄原有強中心模式,通過加密技術、區塊鏈技術和開放開源的結合,從機制上保證交易中心自身無法復制和留存數據,讓數據交易雙方放心,同時要能起到交易公證、監督、追溯等管理職責,切實為交易雙方服務。
讓中心自己去掉中心功能,真的是有點難,但是,欲練神功,必先自宮,為了數據交易的蓬勃發展,你準備好了嗎?
作者簡介:韓洪慧,上海憑安網絡科技有限公司、上海憑安征信服務有限公司 聯合創始人。12年的信息安全從業經驗,4年的大數據征信從業經驗。專注于網絡身份認證、電子簽名、數據安全、隱私保護、網絡取證等領域研究。