這么多人裝X的人聊區(qū)塊鏈,區(qū)塊鏈究竟是個什么系統(tǒng)?
很多人聊區(qū)塊鏈,但其實搞不清楚它究竟是啥,從技術的角度,從架構的角度,說說區(qū)塊鏈是個什么系統(tǒng)。
畫外音:可忽略AI起的標題。
究竟啥是區(qū)塊鏈?
一句話,區(qū)塊鏈是一個存儲系統(tǒng)。一個沒有管理員,每個節(jié)點都擁有全部數(shù)據(jù)的分布式存儲系統(tǒng)。
通常所見的存儲系統(tǒng)是啥樣的?
如上圖,一塊空間存儲數(shù)據(jù),一個軟件管理數(shù)據(jù),提供接口寫入數(shù)據(jù),這是存儲系統(tǒng),例如mysql。
普通的存儲系統(tǒng)會有什么常見的問題?
常見的有兩個問題:
- 數(shù)據(jù)存在一個地方很危險,空間損壞數(shù)據(jù)就丟了,用技術的話說即“數(shù)據(jù)不高可用”;
- 寫入點只有一個,用技術的話說即“單點控制”;
如何保證數(shù)據(jù)高可用?
解決高可用要“冗余”,如上圖,如果能把數(shù)據(jù)冗余到多個地方,就能保證高可用,一個地方的數(shù)據(jù)掛了,另外的地方仍存有數(shù)據(jù)。例如mysql主從集群,以及磁盤的RAID都是這個原理。
這里需要強調(diào)兩點:
- 數(shù)據(jù)冗余往往會引發(fā)一致性問題,例如mysql主從集群中的讀寫延時問題;
- 數(shù)據(jù)冗余往往會降低寫入效率,因為同步數(shù)據(jù)需要消耗額外的資源;
可不可以多點寫入?
可以。可以多個節(jié)點都實施寫入,例如mysql雙主集群,又或者多機房多活數(shù)據(jù)中心。這里要強調(diào)的是,多節(jié)點寫入往往會引發(fā)寫寫沖突的一致性問題。
多點控制寫入之后,其實出現(xiàn)了多中心控制,在數(shù)據(jù)不一致的時候,往往需要有一個算法來協(xié)商如何處理不一致數(shù)據(jù)。
- 例如,存在兩個中心節(jié)點時,可以約定這樣的算法來處理不一致:以時間戳最小的數(shù)據(jù)為準,即先來先得。
- 又例如,存在多個中心節(jié)點時,可以約定這樣的算法來處理不一致:投票,以多數(shù)票的數(shù)據(jù)為準。
什么是區(qū)塊鏈?
有了上面的鋪墊,區(qū)塊鏈就不難理解了。
- 區(qū)塊是一塊存儲空間,可以存儲數(shù)據(jù);
- 區(qū)塊鏈不但像鏈表一樣把區(qū)塊串起來,還有約定了一系列的方法管理這些數(shù)據(jù),所以它是存儲系統(tǒng);
- 區(qū)塊鏈有很多節(jié)點,每個節(jié)點都保存了全部的數(shù)據(jù),所以它是高可用的;
- 每一個中心節(jié)點都可以生成區(qū)塊,并寫入數(shù)據(jù),所以每一個點都是中心節(jié)點,或者說區(qū)塊鏈是去中心化的,要想控制整個系統(tǒng),必須控制一半以上的節(jié)點,才能控制投票,于是這個系統(tǒng)沒有管理員;
綜上,區(qū)塊鏈實際上是一個沒有管理員的,去中心化的,每個節(jié)點都擁有全部數(shù)據(jù)的分布式存儲系統(tǒng)。只要你愿意,你隨時可以成為區(qū)塊鏈中的一個節(jié)點,并參與區(qū)塊的生成與寫入,比特幣就是基于這個分布式存儲上的電子貨幣。
由于節(jié)點很多,很多數(shù)據(jù)需要同步,這個系統(tǒng)的存儲容量其實不大,全球存儲比特幣的區(qū)塊鏈也就幾百G數(shù)據(jù)。
畫外音:互聯(lián)網(wǎng)存儲系統(tǒng),存儲量遠超這個值。
因為節(jié)點很多,數(shù)據(jù)需要保持一致,這個系統(tǒng)的寫入效率也很低,存儲比特幣的區(qū)塊鏈每10分鐘才生成1個區(qū)塊,1個區(qū)塊只有1M的存儲空間,只夠?qū)懭?000筆比特幣交易的數(shù)據(jù)。
存儲比特幣的區(qū)塊鏈,每日約處理30W筆交易,也就是說,系統(tǒng)的TPS只有個位數(shù),這個存儲系統(tǒng)的效率非常低。
畫外音:互聯(lián)網(wǎng)交易系統(tǒng),吞吐量動輒成千上萬。
關于區(qū)塊鏈,本文只說了概念,很多細節(jié)未涉及,如果大家感興趣,未來再聊。
知其然,知其所以然。
思路比結論更重要。