數據庫高可用方案PK：選擇Oracle還是MySQL？

作者：佚名 2017-11-06 11:10:11

關于Oracle和MySQL的高可用方案，其實一直想要總結了，今天分為幾個系列簡單說說。通過這樣的對比，會對兩種數據庫架構設計上的細節差異有一個基本的認識。

高可用方案概覽

Oracle有一套很成熟的高可用解決方案MAA。用我在OOW上的ppt來看，這個方案自9i開始，到今年已經有16個年頭了。

當然，MAA方案雖好，成本還是有的、復雜度還是有的，所以放眼國內的使用情況，RAC不一定是100%有，電信、證券、壽險、銀行如果用，基本都是全套方案，有些相對保守，RAC也有使用active-passive模式的，互聯網行業如果用，清一色都是單實例和DG結合。

而MySQL因為開源的特點，官方和社區里推出了很更多的解決方案，高可用情況大體如下，僅供參考(數據引用自Percona)。

因為時間的原因，MGR剛推出不久，還在觀察期。MGR固然不錯，MySQL Cluster方案也有PXC、Galera等方案，個人還是更傾向于MHA。

基本情況說完了，接下來分為幾個部分來解讀。

Oracle RAC和MySQL MHA

先拿RAC和MHA來做一個基本的對比。

Oracle的解決方案在阿里快速發展時期支撐起了核心業務的需求。大概是這樣的架構體系，看起來很龐大。里面的RAC算是一個貴族，用昂貴的商業存儲，網絡帶寬要求極高，前端大量的小機業務還有不菲的license費用。非常典型的IOE的經典架構。

如果要考慮異地容災，那么資源配置要double，預算翻番。

MySQL的架構方案相對來說更加平民化，普通的PC就可以，但數量級要高，做業務拆分、水平拆分就能夠橫向擴展出非常多的節點，很多大互聯網公司的MySQL集群規模都是幾百幾百的規模，上千都不稀奇。如此之多的服務資源，發生故障的概率還是有的，保證業務服務的可持續性訪問是技術方案的關鍵。如果按照MHA的架構，基本上就是MHA Manager節點來負責整個集群的狀態，好比一個居委會大媽，對住戶的大大小小的事情都了如指掌包打聽。

當然上面的架構圖過于籠統，在MHA的高版本里面還使用了binlogServer，我們從一些細節入手。比如先來說說網絡的事情。

Oracle對于網絡的要求還是很嚴格的，一般都是要2塊物理網卡，每臺服務器需要至少3個IP：Public IP、private IP、VIP，除了共享存儲，至少需要2個計算節點。

private IP是節點間互信的，Public IP和VIP在一個網段，簡單來說，VIP是對外的，是public IP所在網絡的漂移IP，在10g里面都是通過VIP來做負載均衡的，11g開始有了scan-IP，原來的VIP還是保留，所以Oracle里面的網絡配置要求還是很高的。拋開共享存儲，搭建的核心就是網絡配置了，網絡通則通。

scan-IP還可以繼續擴展，最多支持3個scan-ip，如下圖所示：[[208772]]

當然網絡層面不只是這些，我們還有必要了解下TAF(Transparent Application Failover)。TAF是Oracle中對應用透明的故障轉移，在RAC環境中使用尤其廣泛。在RAC中Load Balance這塊確實做了很大的改進，從10g版本開始的多個VIP地址的Load Balance，到11g版本中的SCAN，做了很大的簡化。

而在Failover的實現中，還是有一定的使用限定，比如11g中默認的SCAN-IP的實現其實默認沒有Failover的選項，如果兩個節點中的其中一個節點掛了，那么原有的連接中繼續查詢就會提示session已經斷開，需要重新連接。客戶端TAF主要會討論Failover Method和Failover Type的一些簡單內容。

(1)Failover Method

Failover Method的主要思路就是換取故障轉移時間，或者換取資源來實現。

可以這樣來理解，假設我們存在兩個節點，如果某個session連接到了節點2，然而節點2突然掛了，為了更快處理Failover這種情況，Failover Method有preconnect和basic兩種。

preconnect這種預連接方式還是會占用較多的資源使用，在各個節點上會預先占用一部分額外的資源，在切換時會相對更加平滑，速度更快。
basic這種方式，則在發生Failover時，再去切換對應的資源，中間會有一些卡頓，但是對于資源的消耗相對來說要小很多。

簡單來說，basic方式會在故障發生時才去判斷，而preconnect則是未雨綢繆;從實際的應用來說，basic這種方式更加通用，也是默認的故障轉移方式。

(2)Failover Type

Failover Type實現更加豐富而且靈活，非常強大。這時控制粒度可以針對用戶SQL的執行情況進行控制，有select和session兩種;通過一個小例子說明一下。

比如，我們有個很大的查詢在節點2上進行，結果節點2突然宕機了，對于正在執行的查詢，比如說有10 000條數據，結果剛好故障發生的時候查出了8 000條，那么剩下的2 000該怎么處理。

第一種方式就是使用select;即會完成故障切換，繼續把剩下的2 000條記錄返回，當然中間會有一些上下文環境的切換，對于用戶是透明的。

第二種方式是session;即直接斷開連接，要求重新查詢。

在10g版本中借助于VIP的配置達到Load Balance+Failover的配置如下：

racdb=
(DESCRIPTION =
(ADDRESS= (PROTOCOL= TCP)(HOST=192.168.3.101)(PORT= 1521))
(ADDRESS= (PROTOCOL= TCP)(HOST=192.168.3.201)(PORT= 1521))
(LOAD_BALANCE = yes)
(FAILOVER = ON)
(CONNECT_DATA =
(SERVER= DEDICATED)
(SERVICE_NAME = racdb)
(FAILOVER_MODE =
(TYPE= SELECT)
(METHOD= BASIC)
(RETRIES = 30)
(DELAY = 5))))

如果11g的SCAN-IP也想進一步擴展Failover，同樣也需要設置failover_mode和對應的類型。

RACDB =
(DESCRIPTION =
(ADDRESS = (PROTOCOL = TCP)(HOST = rac-scan)(PORT = 1521))
(CONNECT_DATA =
(SERVER = DEDICATED)
(SERVICE_NAME = RACDB)
)
)

從這個角度來看，Oracle的方案真是精細。

再來看看MySQL的方案。

分布式的方案，讓MySQL看起來像一把瑞士軍刀，對于網絡層面的要求，幾乎可以說MySQL沒有什么要求，申請一主一從的架構，那么就只需要4個IP即可(主、從、VIP、MHA_Manager(考慮一個manager節點))，一主兩從是5個。

這一點上，MySQL原生并不支持所謂的負載均衡(這里說的不是讀寫分離)，可以通過前端的業務來分流，比如使用中間件proxy，或者持續的拆分，達到一定的粒度后，通過架構設計的方式來滿足需求。因為基于邏輯的復制，很容易擴展，一主多從都是很常見的，代價也不高，延遲不能說沒有，只是很低，能夠適應絕大部分的互聯網業務需求。

而說到觸發MHA切換的條件，從網絡層面來看，如下的紅點都是潛在的隱患，有的是網絡的中斷，有的是網絡的延遲，發生故障時，保數據還是保性能穩定，都可以基于自己的需求來定制。從這一點上來說，丟失數據的概率是有的。絕對不是強一致性的無損復制。

把上面的圖放大，其實會有更多的細節，比如ssh的連接檢測和數據庫的心跳檢測(insert_ping)，在整個方案里面要考慮的場景就很多了。對于網絡的切換，目前MHA做的主要是保證數據復制關系，如果要深入使用，還是要做更多的定制，比如結合Proxy的方案，使用ZooKeeper的狀態檢測，使用keepalive或者VIP的網絡層面的切換等。

整體來看兩種方案，RAC是集中共享，除了存儲層面的共享外，網絡層面的組播其實也會提高節點間通信的成本，所以RAC對于網絡的需求很大，如果存在延遲是很危險的，發生了腦裂就很尷尬了。MySQL MHA的方案是分布式的。支持大批量的環境，節點間通信的成本相對來說要低很多。但是從數據架構的角度來說，因為是復制的數據分布方式，所以對于存儲盡管不是共享存儲，對于存儲的成本還是高于RAC(不是說存儲的價格，是存儲的數據量大小)。

Oracle Data Guard和MySQL災備

然后我們來繼續說說災備的部分。我就拿Oracle的DG和MySQL的方案對比。

在災備的概念中，Oracle DBA習慣叫做主備，即為Primary、Standby，而MySQL更喜歡叫做主從，即為Master、Slave，無論怎么叫，說得都是同一個意思。

首先在Oracle中，數據是基于物理復制(此處說的都是physical standby)，所以對于數據庫的狀態和角色就很好定位，從庫正常狀況下是無法讀寫的。所以在Oracle中角色轉換的概念就很清晰，failover和switchover，failover就是故障轉義，switchover就是主備切換。在MySQL中failover的概念很好理解，但是switchover相比來說，就會淡化很多。

Oracle因為是基于物理復制，所以一直以來備庫要么就是恢復狀態(recover)，要么就是只讀不應用狀態(read_only)，直到11g這個問題才解決，就是大名鼎鼎的ADG(read only with apply)。而在MySQL里面這都不是事兒，備庫可以靈活的開關read_only的參數，當然一般是不希望備庫寫入的,讀絕對不是問題，而且還可以擴展著讀，做讀寫分離。

對于Oracle的備庫的理解，我認為除了ADG之外，最有亮點的就是閃回數據庫了，可能很多Oracle DBA都對于閃回數據庫敬而遠之，技術的更新很多，好端端的特性放著不用太可惜了，比如搭建DG，分分鐘DG Broker搞定，使用手工方式不見得有多高效。

閃回的概念在MySQL里面也有，目前來說，可以根據binlog抽取的數據做到DML的閃回，和Oracle里面的閃回差距還很大。Oracle里面的閃回五花八門，零零總總算下，差不多就有這些。

當然常用、實用的不見得這么多，MySQL的DML還算是原生態，可以根據binlog抽取來恢復，或根據第三方工具輔助，但DDL就是難上加難了，目前MariaDB的DDL閃回就是一個突破，從我的理解來說，應該能夠實現一部分的閃回功能，具體的效果我后面測試一下。

所以說閃回是個大寶藏，到底有多好呢，Oracle的備庫方案有了快照數據庫，就是物理備庫可以臨時寫入，帶來的優點就是主庫的碎片，在備庫是完全一樣的。所以在SQL審核方面有著得天獨厚的優勢，我在線上的很多DDL審核中都做過測試和實際應用，效果很贊，而且11g中的閃回可以在線開在線關，所以一般10g里面我建議要慎重使用，11g有條件下備庫端還是推薦的，滿足需求就行。當然閃回數據庫不是萬金油，有個別場景是不支持的，在此就不展開了。

對于災備來說，數據庫的切換是未雨綢繆的事情，那么到底備庫切換的檢查是否OK呢，Oracle里面有了DG Broker這么一個神器，還在新版本中做了很多不錯的選項，比如新版本中有了validate的選項，可以檢測主備切換的條件是否滿足。下面是DG Broker的命令中多出來的validate命令，效果還是不錯的。

此外，從高可用的角度來說，如果在備庫存在連接，做switchover時，會話會持續保持，當然會有短暫的卡頓。這也就是特色的會話保持特性。

Preserving Active Data Guard Application Connections

當然在MySQL里面就不可理解了，切換別說會話保持，卡頓的影響都微乎其微。因為Oracle基于物理復制的方式，物理一致性使得復制擴展性很難，當然也不是說完全不能實現，比如cascade standby，可以級聯復制，到了12c改進一版，就是Far Sync，號稱是零數據丟失，對于跨區域的數據中心來說，會把延遲降到最低。

如果從技術架構的角度來看，部署的分布圖類似下面的形式，中間有遠距離的數據傳輸，可以通過中間的節點來轉換，中間這個節點很特別，是不存數據的，只是保持一個內存結構，同步數據。

還有就是延遲，我測試過DG的延遲，和MySQL在基本相似的壓力情況下，Oracle基本上控制在0.1秒左右，MySQL的復制就會有一些延遲的放大。

所以總體看下來，Oracle的方案是一種很專業的解決方案，工具全，架構相對復雜，數據同步是強一致性。所以在涉及交易的業務中對它更加偏愛。

再來看看MySQL方向的改進。我們不比單機性能和延遲了，因為這個確實是有差距，而且硬拼也沒有太大的意義，我們從整體架構角度來考慮，這些又是Oracle難以實現的地方。

首先說下主從復制，MySQL是典型的邏輯復制，主庫端可以承載大批量的并發，但是性能瓶頸很明顯，主庫的并發最后落到文件上還是串行的，拋開日志傳輸進程的開銷，最大的瓶頸就在于SQL_Thread的應用延遲。就好比中午大家出去吃飯，前臺可以并發點很多的菜品，但后臺的廚師就好比是SQL_Thread，他得一道菜一道菜做啊。怎么能做得更快呢?比如你叫了5分蓋飯，他可以一次性炒出來，這樣就能夠大大提高效率，所以前臺的小姑娘也會建議你和其他人點一樣的菜，原因就一個字——快。這用在并行復制上就是類似的道理。MySQL 5.6沒法做到細粒度的并行復制，只能在庫級別，而在MySQL 5.7中可以做到表級別更細粒度的，這個改進就很明顯了。

所以延遲的問題能夠解決，后續的擴展就容易多了，MySQL的擴展甚至可以做到指數級的擴展方式，如果允許一些低延時，大量的讀請求就可以逐步分解。所以一主多從的架構方式也是見怪不怪。

值得一提的是MHA的一主多從架構中，如果多個從庫存在延遲，在切換的時候MHA會補齊差異的日志，這是MHA的一大亮點。

而MySQL的級聯復制就更純粹了，和Oracle相比的最大優勢就是一個數據庫可以既是主庫也可以同時是從庫，起到承上啟下的作用。

這種擴展方式簡直是酸爽，在一些跨數據中心的場景，允許一定延遲的情況下還是有用武之地。比如你需要從北美讀數據，可以從北美推送數據庫到香港或者新加坡，再推送到北京。有了這種方式就很容易擴展。當然在實時交易中還是存在一些瓶頸和缺陷。

展望和后續補充

如果拋開具體的數據庫，整體來說數據量和業務量到達一定程度都會碰到一系列的問題。這些都是痛點也是難點，常見的問題如下：

單臺服務器無法承載已有的壓力
數據庫單表容量越來越大
大量的讀寫需求無法平衡
資源如果擴容，應用改動較大
資源的負載沒法拆分，或者不易拆分

這時就需要擴展，就需要匹配的解決方案，比如中間件的方案，有的解決了一些通用的問題，有些側重于某一方面。比如需要考慮sharding來分片，讀寫分離來做分擔讀寫壓力，前端海量訪問可以通過大量的水平擴展來分擔。

從這個角度來說，MySQL是以架構和規模取勝，通過業務拆分和架構拆分能夠實現線性擴展。而Oracle的擴展性雖然沒有那么好，但從架構和業務層面來說也能做，這個后續有機會再細細說一說，可以擬一篇分布式方面的文章。

小結

簡單總結一下，高可用的方案選擇很多，各家有各家的需求，能定制的定制，能開源的開源。大道至簡，只要滿足了需求，系統穩定不背鍋，那就是最好的方案。

責任編輯：龐桂玉來源： DBAplus社群

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數據庫高可用方案PK：選擇Oracle還是MySQL？