區塊鏈究竟是啥?一分鐘系列
區塊鏈,比特幣這些概念很火,但很多人搞不清楚它究竟是啥,從技術的角度,從架構的角度,用通俗的語言談談樓主的理解。
究竟啥是區塊鏈?
一句話,區塊鏈是一個存儲系統。
更細一點,區塊鏈是一個沒有管理員,每個節點都擁有全部數據的分布式存儲系統。
通常所見的存儲系統是啥樣的?
如上圖,一塊空間存儲數據,一個軟件管理數據,提供接口寫入數據,這是存儲系統,例如mysql。
普通的存儲系統會有什么常見的問題?
常見的有兩個問題:
(1)數據存在一個地方很危險,空間損壞數據就丟了,用技術的話說即“數據不高可用”;
(2)寫入點只有一個,用技術的話說即“單點控制”;
如何保證數據高可用?
解決高可用要“冗余”,如上圖,如果能把數據冗余到多個地方,就能保證高可用,一個地方的數據掛了,另外的地方仍存有數據。例如mysql主從集群,以及磁盤的RAID都是這個原理。
這里需要強調兩點:
(1)數據冗余往往會引發一致性問題,例如mysql主從集群中的讀寫延時問題;
(2)數據冗余往往會降低寫入效率,因為同步數據需要消耗額外的資源;
可不可以多點寫入?
可以。可以多個節點都實施寫入,例如mysql雙主集群,又或者多機房多活數據中心。這里要強調的是,多節點寫入往往會引發寫寫沖突的一致性問題。
多點控制寫入之后,其實出現了多中心控制,在數據不一致的時候,往往需要有一個算法來協商如何處理不一致數據。
例如,存在兩個中心節點時,可以約定這樣的算法來處理不一致:
(1)以時間戳最小的數據為準,即先來先得;
又例如,存在多個中心節點時,可以約定這樣的算法來處理不一致:
(2)投票,以多數票的數據為準;
什么是區塊鏈?
(1)區塊是一塊存儲空間,可以存儲數據;
(2)區塊鏈不但像鏈表一樣把區塊串起來,還有約定了一系列的方法管理這些數據,所以它是存儲系統;
(3)區塊鏈有很多節點,每個節點都保存了全部的數據,所以它是高可用的;
(4)每一個中心節點都可以生成區塊,并寫入數據,所以每一個點都是中心節點,或者說區塊鏈是去中心化的,要想控制整個系統,必須控制一半以上的節點,才能控制投票,于是這個系統沒有管理員;
綜上,區塊鏈實際上是一個沒有管理員的,去中心化的,每個節點都擁有全部數據的分布式存儲系統。只要你愿意,你隨時可以成為區塊鏈中的一個節點,并參與區塊的生成與寫入,比特幣就是基于這個分布式存儲上的電子貨幣。
由于節點很多,很多數據需要同步,這個系統的存儲容量其實不大,目前全球存儲比特幣的區塊鏈也就100多G。
畫外音:額,有朋友說他們公司的mysql數據庫輕輕松松幾百G。
因為節點很多,數據需要保持一致,這個系統的寫入效率也很低,存儲比特幣的區塊鏈每10分鐘才生成1個區塊,1個區塊只有1M的存儲空間,只夠寫入2000筆比特幣交易的數據。畫外音:比特幣全球交易,每10分鐘只能處理2000筆交易。有朋友說他們公司自研的存儲系統輕輕松松;每秒處理交易10W筆。
關于區塊鏈,本文只說了概念,作為一個存儲系統,數據的生成,寫入,管理,數據一致性,數據沖突處理方法,數據完整性保證…很多細節未來再用“通俗技術性文字”和大家分享。
【本文為51CTO專欄作者“58沈劍”原創稿件,轉載請聯系原作者】