數據統治世界?且看區塊鏈如何解決數字身份難題
“那些統治數據的人將會統治整個世界……這是未來人們會說的話。” 這句話出自孫正義之口³ 。如果我們在這個前提上達成一致,那么問題就變成了,你希望誰來擁有這些數據?你是希望這些數據由公司控制,還是希望自己對數據擁有所有權和控制權?
隨著我們的生活越來越數字化,我們的數字身份會由我們留下的一系列數字足跡(數據點)組成。因此,數字身份與數據是密不可分的。而以下內容,將概述區塊鏈技術如何通過最小披露模型和可貨幣化的數據所有權,防止數據的意外訪問,然后重點介紹為確保更安全的數據交換而采用的一些技術。鑒于很多技術都嚴重依賴于我們的數據,保護和擁有我們的數字身份(可以說是我們最有價值的資產之一),已變得越來越重要。
注:本文并沒有全面列出區塊鏈行業的數字身份解決方案,而是一個高level的概述,旨在說明區塊鏈技術與數字身份討論相關的一些方式。
在數字世界,數據 = 身份
我們認為,身份可分為兩個不同的方面。一個是“成為一個人或一件事物是什么”的事實。我在之前的文章《數字身份的影響》,集中討論了區塊鏈技術如何用于創建一個與獨特且可驗證的“數字指紋”相聯系的去中心化個人身份。而接下來,文章將主要關注身份方面的第二點,可將其定義為“決定一個人是誰或一件事是什么的特征⁵。”
“我們到處都留下數字足跡,語音技術的進步以及家庭設備的相應增長,意味著數據收集不再局限于我們的在線生活。我們所有的步驟都可以拼湊到一起,從而準確地描繪出我們做什么、喜歡什么、與誰交談、花多少錢以及最終我們是誰。”
我不會去調查大規模數據泄露的具體情況,也不會去調查用戶數據在很多“免費”和廣泛使用的互聯網服務商業模式中所扮演的角色??梢钥隙ǖ恼f,我們已失去了對數據的控制,因此,我們對數字身份幾乎沒有什么控制權。
為什么它是重要的:意外訪問和意外推論
或許,法院大法官路易斯·布蘭代斯(Louis Brandeis)最恰當地將隱私的歷史觀描述為“獨處權”?,F在,隱私權將被更好地描述為“控制我們無法停止生成數據的能力”。更重要的是,隨著我們每天生成越來越多的數據,這些數據現在引發了對隱私權的推論。我們不能很簡單地預測,我們不知道我們的數據被收集到了什么程度,與誰共享,或者它被用于獲得對我們身份的洞察方式。有時,我們的數據會以不明顯的方式被使用。例如,機器學習可以應用于谷歌搜索,以得出與健康相關的推論,語言模式可通過匿名編寫的文本/代碼檢測,從而推斷作者身份,還有無數其他的例子。
關于我們的數據被用來賣的事實,即使我們已開始接受,但背后“數據購買”的目的,我們通常也是不清楚的。
傳統上,安全與隱私是兩個截然不同的領域,其中安全涉及數據的保護,而隱私則涉及用戶身份的保護。由于數據現在是數字身份的一個主要組成部分,二者融合在了一起,而更多的重點放在了隱私上,而隱私在歷史上一直是更緊迫安全問題的后座。換言之,在一個多產的機器學習應用程序引起對意外推斷的關注的世界中,防止意外訪問數據,成為了一個更高的優先級。
各國政府已注意到并開始實施數據隱私法規(例如歐洲的GDPR),但是,數據隱私法規可能會是無效的。
但這并不意味著用戶或組織不應該共享他們的數據。保持數據私有,并不意味著數據必須存放在地下貯藏庫,真正的問題是意外訪問!
區塊鏈技術可通過促進模型,使敏感信息和機制實現披露最小化,通過這些模型,數據所有者可獲得允許訪問的相應補償。而以隱私為中心的區塊鏈,還可提供更安全的信息交互方式。
最小披露模型
用戶在網上交易時,會反復披露非相關但敏感的信息。例如,如果一家公司需要證明Alice的年齡足以租車,租車公司可能會要求Alice提供一份駕駛執照的復印件,其中包括她的地址、駕駛執照號碼以及她出生日期以外的其他人口統計信息,而她可能不想分享這些信息。其實,租車公司只需要知道她是否符合租車年齡,他們不需要知道她的身高或者是否居住在市中心,他們甚至不需要知道她的確切生日,他們只需要知道她已超過了一定的年齡。與多方反復共享不必要的信息,會造成更多的弱點。而最小披露模型,利用區塊鏈技術,大大減少了存儲敏感識別信息的各方的傳輸和數量。

資料來源:Civic
例如,Civic就開發了一個這樣的最小披露模型,其重點是利用證書頒發機構創建“可重用的know-your-customer”。Civic創建了一個系統,在該系統中,可使用以前經過審計的PII(個人識別信息)來確保第三方的身份,而無需重新共享基礎PII。使用上面的例子,對于Civic而言,Alice只需通過一次know-your-customer流程,然后驗證其know-your-customer的實體(不幸的是,這一步仍然需要標準的ID格式)可提供Alice的PII符合某些標準的證明。更具體地說,驗證實體可以向租車公司提供一份證明,證明Alice超過了租車所限制的年齡,而不會透露任何關于Alice的附加信息。而civic token(cvc),則用于激勵第三方驗證程序提供證明,其也可用于購買“身份相關產品”,如安全登錄/注冊、多重驗證等。
正如在多個平臺上共享相同的敏感數據會造成泄露一樣,在多個平臺上使用相同的用戶ID和密碼,不僅從安全角度來看是不好的策略,而且會導致帳戶關聯和跟蹤的問題。考慮到這一點,微軟設計了自己的針對身份驗證的最小披露模型。
微軟設計了一個開源的、可互操作的第二層DID實現,用戶在其中創建一個DID,然后將其鏈接到非PII數據。用戶的實際身份數據(PII)在鏈外加密并由用戶控制。DID是用戶生成的,不限于每個帳戶一個,這樣做的目的是避免在多個平臺或服務提供商之間跟蹤和跟蹤一組登錄憑據。DID可以是公開的,也可以是成對的(在隱私很重要的情況下,因此交互需要被隔離和防止相互關聯的情況下)。

資料來源:微軟
為了完成一個具體的示例,我們假設Alice想通過外部方的身份驗證。Alice將向該方披露一個DID,該方將通過通用解析程序查找所披露的DID,然后該解析程序將返回與該DID對應的匹配非PII元數據。然后,外部方使用元數據中的公鑰引用創建一個“挑戰”,并與Alice進行“握手”,證明Alice是DID的所有者。為了防止“虛假身份”的產生,最初可能需要證明,直到通過多次證明或背書建立可信度。請求身份驗證的組織,可能需要多個證明才能進行更高風險的交互。
交易所Coinbase也特別注重身份識別,其成立了專注于此主題的專業團隊,最近其還收購過專注于去中心化身份的分布式系統公司。除了身份的其他方面外,該公司似乎還將重點放在最小程度的披露上,因為該公司強調了去中心化身份如何讓用戶證明他們與社會保障管理部門有關系,而無需出示其SSN的實際副本。盡管社會保障管理局和數字媒體管理局,目前它們是美國非常強大的身份信息提供者,但隨著世界越來越數字化,Coinbase相信,這種模式最終可能擴展到社會媒體帖子、照片和個人數字身份的其他組成部分。
可貨幣化的數據所有權
盡管最小披露模型主要關注保護個人標識符(SSN、DOB和其他PII), 但構成用戶在線身份的非PII數據點也需要得到保護。如果用戶可擁有自己的數據,并控制對數據的訪問,理論上,這些數據的價值將附加給其所有者,而不是當前收集數據的平臺(谷歌、Facebook、亞馬遜)。“數據是有價值的,它們就屬于你”,這是美國加州州長 Gavin提出的“數字紅利”。這使得消費者可分享那些“收集、整理和貨幣化”用戶個人數據的科技公司的利潤。然而,這種方法不允許等量的補償,只相當于對大型科技公司征稅,然后平均分配給個人。相反,區塊鏈技術允許一個更動態的系統,在該系統中,用戶可控制自己的數據,并可直接將對該數據的訪問進行貨幣化,這與他們選擇提供的訪問級別相稱。
目前,市場上有幾家區塊鏈公司,在使用和開發不同的階段,旨在為用戶創造能使他們自己的數據實現貨幣化的市場。BAT就是這樣的一個例子,BAT代表基本注意力代幣,這是一種ERC-20 token,在這個系統中,廣告商根據用戶的關注度給予出版商BAT。用戶也會收到BAT,他們可選擇將其捐贈給出版商或在平臺內使用它們。在未來,廣告商可以參與一個系統,在這個系統中,用戶收到一個BAT作為一個廣告的交換條件。Zinc是另一個具有類似目標的區塊鏈項目,同樣,Vetri是一個基于區塊鏈的數據市場,通過該市場,用戶可以向營銷人員賣匿名數據,以換取VLD代幣,而VLD代幣可用于在平臺內購買禮品卡。

來源:Basic Attention Token
其他例子還包括Fysical和Steemit。Fysical正在創建一個位置數據交換平臺,而Steemit 則是一個內容平臺,其允許用戶發帖點贊等方式獲得token。
數據交換
在數據交換過程中,即使數據是匿名的,也可能發生對數據的意外訪問。這是一個問題,因為數據交換是持續創新的必要條件:跨醫療機構共享醫療和基因組數據,可加快新療法的發現,跨金融機構進行數據分析,可避免金融危機,而共享駕駛數據,則可能對自動駕駛的發展而言至關重要。雖然區塊鏈技術可促進不信任方之間的數據交換,但這種數據交換仍然容易受到隱私問題的影響。幸運的是,有幾家區塊鏈公司專注于從一開始就構建以隱私為中心的網絡。
Oasis Labs就是這樣一家公司。 Oasis Labs正在采用一種完整的隱私堆棧方法,利用可信的執行環境(安全enclave)、安全的多方計算、零知識證明和差異隱私。這限制了在協議層訪問數據的各方,并限制了在應用層匿名數據的數據泄漏。Enigma是另一個專注于利用類似隱私技術創建可擴展隱私協議的項目。
挑戰
再一次強調,以上列出的區塊鏈項目列表并不是完整的。關于數據隱私項目,你可以查看《數字身份的影響》以及由我的朋友Bosun Adebaki撰寫的《區塊鏈與金融包容性的斗爭》這兩篇文章。
所有權:雖然個人控制對其數據的訪問,從而使其貨幣化的想法聽起來很有吸引力,但在實踐中,這可能是一個挑戰。創建個人數據交換市場的一個問題是,數據產權尚未定義。一旦數據與第三方共享,就很難定義所有權,并且一旦信息已知,就很難阻止該信息的二級市場形成。
評估和支付意愿:最初很難確定不同數據的價值或支付隱私權的意愿,特別是由于用戶多年來一直在免費提供數據。此外,還不清楚個人數據貨幣化所帶來的收益,是否足以抵消當前用戶體驗摩擦(密鑰管理等)及不確定性。
追索權:在去中心化的數據交換中,對濫用的追索權也尚不清晰。
在最近的一次視頻采訪中,馬克·扎克伯格就談到了如何用更分布式的系統取代社交媒體巨頭的單點登錄(SSO)應用程序Facebook Connect。然而,他也提出了一些同樣的問題:
“問題是,你真的想要嗎?你是否有更多的案例,是的,人們可能沒有中間人,但會有更多的濫用案例,追索將會變得更加困難?”
盡管如此,在某些行業,安全交換數據的需求對于業務的生存能力(例如,自動駕駛)而言是至關重要的,因此企業的價值主張可能更高,足以抵消用戶體驗或其他方面的任何痛點。
既然身份是數字的,身份就與數據密不可分。鑒于很多技術都嚴重依賴于我們的數據,保護和擁有我們的數字身份,已變得越來越重要。我們需要區塊鏈技術來幫助我們重新獲得對數據的控制,因為數據的意外訪問可能會導致無法預料的后果。社會已經反映了,我們需要繼續建設區塊鏈這樣的技術。
注:原文作者是伯克利區塊鏈顧問