區塊鏈(BlockChain),是區塊(Block)和鏈(Chain)的直譯,其數據結構如圖1所示,即每個區塊保存規定時間段內的數據記錄,并通過密碼學的方式,構建一條安全可信的鏈條,形成一個不可篡改、全員共有的分布式賬本。
比特幣的區塊分為區塊頭和區塊體兩部分。區塊頭的大小為80字節,包括4字節的版本號、32字節(256位)的上一區塊哈希值、32字節的Merkle根節點、4字節的時間戳、4字節的難度值和4字節的隨機數。區塊體包含10分鐘內選定的交易記錄,第一筆交易(coinbase交易)是用于獎勵礦工比特幣的特殊交易,由礦工自己添加進區塊。
圖1 區塊鏈的數據結構示意圖
基本概念
區塊鏈是很多現有技術交叉融合在一起的集成創新。因此,要了解區塊鏈,首先要了解區塊鏈到底集成了哪些技術。
P2P網絡
如圖2所示,P2P(Peer-to-Peer)網絡是一種端到端的網絡。P2P網絡分為結構化(例如基于Chord的P2P網絡)和非結構化的P2P網絡(例如Gnutella)。比特幣的區塊鏈采用的是非結構化P2P網絡,整個網絡沒有中心化的硬件或管理機構,任一節點既是服務端,也是客戶端。任何節點只要安裝相應的客戶端軟件,就能接入P2P網絡(例如BT軟件),參與區塊鏈的記錄和驗證,不超過1/3節點的損壞、退出甚至被植入惡意代碼,都不會影響整個系統的運作。
圖2 傳統中心化系統和P2P網絡的拓撲對比圖
加密算法和數字簽名
加密技術分為對稱、非對稱和哈希(Hash)加密。對稱加密是指用同樣的密鑰來進行加密和解密,非對稱加密是指用一個密鑰對來進行加密和解密,哈希加密主要是通過對數據進行哈希運算,用固定的哈希結果值驗證信息是否被篡改。
非對稱加密
在非對稱加密技術中,對外公開、分發出去的密鑰叫做公鑰,不能公開、自己留存的密鑰叫做私鑰。公鑰加密的,對應的私鑰才能解密。反之亦然。如圖3所示。
圖3 非對稱加密RSA算法的簡化示例圖
非對稱加密算法有RSA、DSA和ECC等種類,區塊鏈使用的是基于橢圓曲線加密技術的數字簽名(ECDSA),具體實現是secp256k1。ECDSA相當于是DSA和非對稱加密ECC的結合。相比RSA算法,ECDSA具有計算量小、存儲空間小、帶寬要求低等特點。
數字簽名
基于數字簽名的通信機制工作原理,如圖4所示,發送報文時,發送方用一個哈希函數從報文文本中生成文件摘要,然后用自己的私鑰對摘要進行加密,加密后的摘要將作為報文的數字簽名和報文一起發送給接收方。接收方首先用與發送方一樣的哈希函數從接收到的原始報文中計算出報文摘要,接著再用發送方的公鑰來對報文附加的數字簽名進行解密,如果得到的明文相同,那么接收方就能確認傳輸的文件并未受到篡改,是安全可信的。
圖4 數字簽名的流程示意圖
哈希加密
安全哈希算法(Secure Hash Algorithm,SHA)是由美國國家安全局研發,由美國國家標準與技術研究院(NIST)發布的一系列密碼哈希函數,包括SHA-0、SHA-1、SHA-2和SHA-3等系列。比特幣的區塊鏈使用的是SHA-256哈希加密算法,于2001年發布,屬于SHA-2分支。由于SHA256偽隨機性的特點,只要是相同的數據輸入,一定會得到相同的結果,如果輸入數據稍有變化,將得到一個千差萬別的結果,如圖5所示。SHA256還是一個單向不可逆的算法,即根據一個輸入數算SHA256的結果很容易,但根據SHA256的結果反算輸入數幾乎是不可能。除此之外,比特幣還使用ripemd160算法來生成比特幣錢包的地址。

圖5 哈希加密的示意圖
梅克爾樹
梅克爾(Merkle)樹是區塊鏈的基本組成部分。如果沒有梅克爾樹,區塊鏈也是可以運轉,但是要在區塊頭里包含所有交易記錄,擴展性方面存在很大挑戰。如圖6所示,區塊鏈中的每個區塊,由區塊頭和區塊體構成,區塊頭中含有一個Merkle根節點的字段,通過對區塊體中所有交易記錄,以二叉樹的形式迭代地兩兩拼接 、進行哈希操作,可以得到一個最終的哈希值,我們稱之為Merkle根哈希。Merkle根哈希相當于是對區塊中所有交易記錄進行了一個快照,區塊中交易記錄的任意改動都可以通過比較Merkle根哈希而很容易地察覺。Merkle根哈希主要用于簡單支付驗證(SPV),在驗證某個交易是否在區塊中時,也能極大地減少網絡傳輸成本。

圖6 Merkle樹示意圖
工作量證明機制
工作量證明機制,簡單地說,就是一種共識機制,用來確認你是否做過一定量工作的證明。比特幣的區塊鏈主要是依托計算數學難題來衡量工作量。每個區塊,當選定一定數量的交易記錄之后,填充版本號、時間戳、難度值,生成相應的Merkle根哈希。很容易看到,這些數值在選定交易記錄以后,都是確定的,唯一能夠改變的就只有隨機數(Nonce)這個值。如圖7所示,系統根據難度值,要求計算整個區塊頭的兩次SHA256算法,得到的哈希結果要小于一個閾值。根據前面描述的SHA256算法的偽隨機性,只有通過不斷地嘗試和枚舉,才能找到相應的隨機數,證明自己的工作量。
圖7 工作量證明機制示意圖
除了工作量證明機制(PoW)這類共識機制之外,還有股權證明機制(PoS)、授權股權證明機制(DPoS)、拜占庭容錯機制(BFT)、實用拜占庭容錯機制(PBFT)這些在不可信環境下的共識機制以及要求在可信環境下的共識機制,例如PaxOS和Raft。表1是做了簡單的對比。

表1 共識機制的簡單對比表
運行機制
接入網絡和驗證
節點通過安裝相應的軟件(例如比特幣核心),接入區塊鏈。節點啟動以后,主要是在P2P網絡上發現鄰居節點、鏈接鄰居節點、傳遞P2P消息和下載區塊鏈驗證。節點可以選擇下載全量的區塊鏈進行驗證,或者是只下載區塊頭,通過Merkle樹節點來進行簡單支付驗證(SPV)。
錢包軟件可以分為移動錢包、桌面錢包、互聯網錢包和紙錢包,都支持保存用戶的私鑰,錢包也可以根據私鑰是否是種子產生的,而分為決定性錢包和非決定性錢包,關鍵區別在于私鑰的備份和易恢復性。
區塊鏈的存儲和接受
比特幣的區塊鏈使用Berkeley DB(文件數據庫)作為錢包數據庫,使用LevelDB(鍵值數據庫)存儲區塊的索引和UTXO(Unspent Transaction Output,未開銷的比特幣交易輸出)。節點在啟動的時候,將整個區塊鏈的索引從LevelDB加載入內存。當收到一個新區塊時,節點對新區塊中的所有交易進行檢測,驗證交易格式、交易大小、交易簽名、UTXO是否匹配、交易簽名、腳本合規等方面。
如果驗證成功,檢查上一區塊頭與鏈頭區塊哈希值是否一致,如果是一致,則更新UTXO數據庫和回滾交易數據庫,如果不是,則將該區塊放在孤兒區塊池中 。當節點發現網絡中存在另一條更長的區塊鏈時,就需要斷開現有的區塊并對區塊鏈進行重組。如果驗證不成功,會拋棄該區塊,繼續等待新區塊的到來(礦工會繼續計算新區塊的數學難題)。
區塊鏈的工作量證明計算機制
“礦工”角色的節點一直收集網絡中廣播的交易記錄,并致力于計算新區塊的數學難題,即工作量證明。如果其他節點發來的新區塊驗證成功,節點除了更新UTXO數據庫和回滾交易數據庫,節點會立即開始下一個新區塊的計算。新區塊的構建優先選取交易內存池中優先級高的交易記錄。優先級的計算方式為:
如果自己的工作量證明計算成功,節點會第一時間將這個區塊廣播至整個網絡中,其他節點收到該新區塊,如上所述,會進行相應的驗證和存儲。
整個區塊鏈的運轉機制如圖8所示。
圖8 區塊鏈運轉機制示意圖
其他相關
腳本語言
區塊鏈采用的腳本語言并不是圖靈完備的語言,不支持循環,只能進行堆棧式操作。這種腳本語言的好處是,不允許礦工提交一個死循環的腳本,更注重的是安全方面的考量,但其擴展能力有限。從以太坊為首的區塊鏈編程平臺支持圖靈完備的編程語言,引領區塊鏈跨入2.0時代。由于支持循環等復雜操作,以太坊用Gas(燃料)機制來防止死循環的出現,確保系統的安全。
消息隊列
比特幣區塊鏈采用Zero MQ(ZMQ)作為消息分發和消息隊列管理工具。與很多人熟悉的RabbitMQ相比,ZMQ不像傳統意義的消息服務器,更像一個底層的網絡通信庫,在多個線程、內核和主機盒之間彈性伸縮,在Socket API之上將網絡通信、進程通信和線程通信抽象為統一的API接口。
挖礦設備和算法演進
挖礦設備從支持復雜指令(CISC)、適合串行計算的CPU礦機時代,經由基于眾核體系、適合并行簡單計算的GPU挖礦和低功耗卻價格昂貴的FPGA挖礦,逐漸向集約高速的ASIC礦機和規模效應的礦池演進。