隱藏在圖像數據庫中的安全問題
由于系統改造的代價之高,使用適于系統設計的網絡安全措施則是最好的選擇。而新科技和應用則帶來更多安全與隱私的新挑戰。此外,新技術的應用效果經常難以預測,例如本文介紹的圖像數據庫——一項越來越受歡迎的數據庫科技。本文探索了圖像數據庫的價值以及調查了其中一些數據庫的安全與隱私問題。
NoSQL的出現
關系數據庫管理系統(RDBMS) 是在E.F.Codd博士發表的論文《大規模共享數據銀行的關系型模型》(Communications of the ACM雜志1970年6月刊)基礎上設計出來的。它通過數據、關系和對數據的約束三者組成的數據模型來存放和管理數據。目前許多企業的在線交易處理系統、內部財務系統、客戶管理系統等大多采用了RDBMS。太字節級關系型數據庫在大型企業集團中已是司空見慣。常用的數據庫軟件有Oracle、SQL Server等。
非關系型數據庫
非關系型數據庫(NoSQL = Not Only SQL)意即“不僅僅是SQL”,是一項全新的數據庫革命性運動,早期就有人提出,發展至2009年趨勢越發高漲。NoSQL的擁護者們提倡運用非關系型的數據存儲,相對于鋪天蓋地的關系型數據庫運用,這一概念無疑是一種全新的思維的注入。簡單地講,NOSQL數據庫可以按照它們的數據模型分成4類:
- 鍵-值存儲庫(Key-Value-stores)
- BigTable實現(BigTable-implementations)
- 文檔庫(Document-stores)
- 圖形數據庫(Graph Database)
圖像數據庫(Graph Database)
圖形數據庫是一種非關系型數據庫,它應用圖形理論存儲實體之間的關系信息。最常見的一個例子,就是社會網絡中人與人之間的關系。關系型數據庫用于存儲“關系型”數據的效果并不好,其查詢復雜、緩慢、超出預期,而圖形數據庫的獨特設計恰恰彌補了這個缺陷。
網絡(如一個電網、一個企業供應鏈或者整個生態系統)通常由大量共享多重關系弧的節點構成。圖像數據庫發揮它這強大的能力來表示網絡的組成和鏈接。圖像數據庫在支持開發、知識管理甚至預測方面已逐步成熟起來。
在互聯網世界,各種不同類型的網絡越來越卓越,正如具備上網能力已經成為了現代社會必須。然而,圖像數據庫(像RDBMS)只是盒子里的另一個工具,可以利用好或者不好。因此,考慮新技術的大規模安全影響并不過早,至少應該從最高的水平開始。
圖像探索(Graph Discovery)
因為處理屬性和鏈接,圖像數據庫包括了海量仍隱藏著的信息。圖形數據庫最初并沒有被視為一種有益于探索的工具,它需要一個特別設計的超級計算機家族才能實現圖像發掘的全部威力。盡管它可以直接展示圖像,并數量增加到數十億,只有最為強大的機器才有能力在計算限制內快速遍歷多路徑。
像是緊密排列的蛋白質網絡一樣,圖像也如此密集。在這里,圖片細節查詢能夠壓垮計算能力較弱的系統。而超級計算機則克服了時間與能力的限制。有些這樣的設備運用了Hadoop分析工具。
為探索而創造的高端圖形超級計算機確實為業界帶來了巨大的希望。例如,它可以支持建立復雜的海洋與構成氣候條件的大氣之間的關系。當氣候發生巨大變化時,會進一步發現非線性因素與結果變得越來越重要。同樣,一臺圖形超級計算機能夠加速發現西非的埃博拉傳播情況,這會有助于防范疾病的傳播。
圖1:基本圖形推理。這個簡單的node-arc-node三位一體,常被成為三元組,是被用來詳細描述構建描述各種各樣復雜網絡的基本工具。
圖2:用于探索的圖形數據庫。這樣的探索可以支持構建海洋與大氣的關系,也可以用來加速發現埃博拉病毒在西非的傳播。
#p#
探索:隱私與安全
圖像探索被認為是一種解決復雜且相互關聯問題的良好工具,然而卻存在大量對于隱私和安全問題的擔憂。舉個例子,如果圖像超級計算機未來成為我們社會或金融交易的監測工具,那么有針對性的廣告與其他的蓄意利用將會侵犯個人隱私,個人的身份很可能被進一步曝光。
期望通過立法來阻止存在的全部威脅是很容易被人理解的,但是社會要付出怎樣的代價呢?正如那些急于通過各種手段將銷售產品的人將會通過大數據而獲利,卻忽略了一旦他們受到攻擊要付出的個人代價又是什么呢?現實就是在這樣一個高端開發僅僅是目前被建立的一個趨勢的投影。
在這種社會經濟研究學設計中,尤其是廣泛涉及社會和商業事物關系的領域,安全要求應該是更高的。近來發生黑客針對信用卡發行方或者電影公司等企業的攻擊事件造成了大規模的破壞,然而任何蓄謀的犯罪攻擊、大數據泄露都能造成更具毀滅性的影響。當由無數傳感器、執行器和移動設備構成的“互聯網+所有”(Internet of Anything,簡稱IoA)會進一步增加安全隱患,這一切似乎都為隱私泄露提供了極大的方便。
圖像知識管理:隱私與安全
安全——特別是定制建筑設計——一定要將這一點考慮在內。如果Web共享被認為是一個生成大量典型三元組系統的合理方式,設計一個RDF(Resource Description Framework,一種用于描述Web資源的標記語言)數據儲存的傳送門將變得異常重要。同樣,用戶身份驗證和檢定都很重要。
盡管知識管理并不是探索運用的廣泛,但是由于關聯的數據庫的特殊身份屬性仍必須受到嚴格保護。前端規定必須同時保證圖像數據庫的防入侵及個人數據隱私的的安全。若數據庫不能提供足夠保護可能會被取消資格,因為備選圖像數據庫產品的接口仍易受攻擊。
圖像預測:隱私與安全
例如天氣或者經濟趨勢,在涉及一個演變過程的動態環境中,預測未來行為的能力變得非常可能。
圖像有助于提高預測的準確性,讓我們可以有資格同時量化一個系統代表的網絡。能夠聯系節點與弧(地址、時間、重量或者數量)的能力讓我們基于相似的屬性從而定性地評價圖像。更重要的是,量化技術讓我們在幾乎所有的圖像中評估內在指標。這也適用于許多領域,像是神經科學。
當前維護網絡安全的最佳實踐通常建議在研究其安全性和隱私性的漏洞時對系統進行快照,以獲得證明系統“安全性”的證明。這種實踐的繆誤在于大多數系統都會受到不斷變化的環境的影響,這些影響將改變系統的活動。所以,這只適用于證明快照拍攝那一瞬的安全。
鑒于數據庫的日趨復雜性,為我們監控實時動態變化提供了有利條件。通過檢測數據流異常節點或關系模式改變了我們使用定量方法,我們能夠檢測以及調查盡早地發現入侵和其他安全漏洞,迅速對任何監測到的犯罪作出反映。
總結
從預測的角度來看,數據完整性必須搶占先機。因此,由于預測的風險很高,數據來源變得至關重要。預測的結果將盡可能的與預測工具暗示的數據一致。錯誤數據會嚴重影響結果,安全也將變為空中樓閣。
良好的安全實踐將帶來最高級別的道德準則。盡管圖像數據庫蘊含著世界各種網絡的巨大希望,它同時帶來了潛在的安全風險還未被完全了解和鑒別。與追求流行時尚不同,IT專業人士必須認真評估預期操作環境與執行必要交易時的潛在風險,以此達到安全和數據保護的基準線。如果安全與隱私問題圍繞新的技術(例如日益流行的圖像數據庫)大量產生,那么在后期會成為一種新燒錢途徑。因為不安全,所以很昂貴。
注:本文原刊登于IEEE IT Professional雜志。
原文鏈接:http://www.myhack58.com/Article/60/63/2015/63033.htm