數(shù)據(jù)庫不適合Docker及容器化的7大原因
所有的服務都開始了容器化升級,在一切皆容器的主流思想下,無狀態(tài)的服務采用容器化已經(jīng)是大勢所趨,常常困擾架構師的一個問題是,數(shù)據(jù)庫是否需要容器化?
如果我們觀察 2017 年技術行業(yè),容器和 Docker 依然將是最熱門的流行語。我們開始在每個領域的 Docker 容器中打包開發(fā)的軟件。從小型初創(chuàng)公司到巨大的微服務平臺都在使用容器技術。從 CI 平臺到 Raspberry Pi 。從數(shù)據(jù)庫到……
數(shù)據(jù)庫?您確定要將數(shù)據(jù)庫放在容器中嗎?
不幸的是,這不是虛構的場景。我看到許多快速增長的項目將數(shù)據(jù)持久化到容器中。并且將計算服務和數(shù)據(jù)服務放在同一臺機器上。筆者希望有經(jīng)驗的人不會用這個解決方案。
下面是我的觀點,數(shù)據(jù)庫容器化從今天來看是非常不合理的。
數(shù)據(jù)庫不適合容器化的7大原因
1. 數(shù)據(jù)不安全
即使你要把 Docker 數(shù)據(jù)放在主機來存儲 ,它依然不能保證不丟數(shù)據(jù)。 Docker volumes 的設計圍繞 Union FS 鏡像層提供持久存儲,但它仍然缺乏保證。
使用當前的存儲驅(qū)動程序,Docker 仍然存在不可靠的風險。 如果容器崩潰并數(shù)據(jù)庫未正確關閉,則可能會損壞數(shù)據(jù)。
2. 運行數(shù)據(jù)庫的環(huán)境需求
常看到 DBMS 容器和其他服務運行在同一主機上。 然而這些服務對硬件要求是非常不同的。
數(shù)據(jù)庫(特別是關系型數(shù)據(jù)庫)對 IO 的要求較高。 一般數(shù)據(jù)庫引擎為了避免并發(fā)資源競爭而使用專用環(huán)境。如果將你的數(shù)據(jù)庫放在容器中,那么將浪費你的項目的資源。 因為你需要為該實例配置大量額外的資源。 在公有云,當你需要 34G 內(nèi)存時,你啟動的實例卻必須開 64G 內(nèi)存。在實踐中,這些資源并未完全使用。
怎么解決? 您可以分層設計,并使用固定資源來啟動不同層次的多個實例。 水平伸縮總是比垂直伸縮更好。
3. 網(wǎng)絡問題
要理解 Docker 網(wǎng)絡,您必須對網(wǎng)絡虛擬化有深入的了解。也必須準備應付好意外情況。你可能需要在沒有支持或沒有額外工具的情況下,進行 bug 修復。
我們知道:數(shù)據(jù)庫需要專用的和持久的吞吐量,以實現(xiàn)更高的負載。我們還知道容器是虛擬機管理程序和主機虛擬機背后的一個隔離層。然而網(wǎng)絡對于數(shù)據(jù)庫復制是至關重要的,其中需要主從數(shù)據(jù)庫間 24/7 的穩(wěn)定連接。未解決的 Docker 網(wǎng)絡問題在1.9版本依然沒有得到解決。
把這些問題放在一起,容器化使數(shù)據(jù)庫容器很難管理。我知道你是一個頂級的工程師,什么問題都可以得到解決。但是,你需要花多少時間解決 Docker 網(wǎng)絡問題?將數(shù)據(jù)庫放在專用環(huán)境不會更好嗎?節(jié)省時間來專注于真正重要的業(yè)務目標。
4. 狀態(tài)
在 Docker 中打包無狀態(tài)服務是很酷的,可以實現(xiàn)編排容器并解決單點故障問題。 但是數(shù)據(jù)庫呢? 將數(shù)據(jù)庫放在同一個環(huán)境中,它將會是有狀態(tài)的,并使系統(tǒng)故障的范圍更大。下次您的應用程序?qū)嵗驊贸绦虮罎ⅲ赡軙绊憯?shù)據(jù)庫。
5. 數(shù)據(jù)庫不適合使用主要的 Docker 功能
考慮容器中的數(shù)據(jù)庫,我們來思考它的價值。 我們先看看 Docker 官方對其的定義:
Docker 是為開發(fā)人員和系統(tǒng)管理員構建,分發(fā)和運行分布式應用程序的開放平臺。 Docker 包括 Docker Engine(便攜式,輕量級運行時和打包工具)以及 Docker Hub(用于共享應用程序和自動化工作流的云服務),Docker 使應用程序能夠以組件快速組裝,并消除開發(fā),QA 和生產(chǎn)環(huán)境之間的不同。 因此,IT 可以更快地分發(fā)程序,并在筆記本電腦,數(shù)據(jù)中心虛擬機和任何云上運行相同的應用程序。
根據(jù)該答案,我們可以很容易定義 Docke r的主要特性:
- 易于構建新環(huán)境
- 易于重新部署(持續(xù)集成)
- 容易水平伸縮(從實踐得出)
- 易于維護環(huán)境一致
讓我們開始思考這些功能如何適應數(shù)據(jù)庫世界。
容易設置數(shù)據(jù)庫? 讓我們看看,容器化或者在本地運行數(shù)據(jù)庫,在運行上是否有巨大的差異。
- docker run -d mongod:3.4
對比:
- sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 0C49F3730359A14518585931BC711F9BA15703C6
- echo "deb [ arch=amd64,arm64 ] http://repo.mongodb.org/apt/ubuntu xenial/mongodb-org/3.4 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-3.4.list
- sudo apt-get update && sudo apt-get install -y mongodb-org
易于構建新環(huán)境?如果我們談論是 MongoDB集群 - 可能容器化效率更高。但是配置管理系統(tǒng)呢?它們旨在通過運行一個命令來解決配置問題。使用 Ansible 你可以輕松設置幾十個 Mongo 實例。正如你所看到的,沒有顯著的價值增長。
容易重新部署?您重新部署數(shù)據(jù)庫升級到下一個版本的頻率是多少呢?數(shù)據(jù)庫升級不是可用性問題,而是工程問題(即在群集中的可用性)。想想你的應用程序?qū)⑷绾问褂眯碌臄?shù)據(jù)庫引擎版本。引擎更換時可能導致的問題。
容易水平伸縮?是否要在多個實例之間共享數(shù)據(jù)目錄?你不害怕直接數(shù)據(jù)并發(fā)問題和可能的數(shù)據(jù)損壞嗎?使用專用數(shù)據(jù)環(huán)境部署多個實例不會更安全嗎?最后搞一個主從復制?
易于維護環(huán)境一致?數(shù)據(jù)庫實例環(huán)境的變化頻率如何?每天升級操作系統(tǒng)嗎?還是數(shù)據(jù)庫版本或依賴軟件變化頻繁?或者是不容易與工程團隊達成共識?
最后看來,沒有一個特性足以讓我考慮數(shù)據(jù)庫容器化。
6. 額外的隔離對數(shù)據(jù)庫是不利的
其實我在第二點和第三點原因中提到了這一點。 但我把這個列為單獨的原因,因為我想再次強調(diào)這一事實。 我們擁有的隔離級別越多,我們獲得的資源開銷就越多。 相比專用環(huán)境而言,容易水平伸縮可以使我們得到更多的好處。 然而在 Docker 中水平伸縮只能用于無狀態(tài)計算服務,而不是數(shù)據(jù)庫。
我們沒有看到任何針對數(shù)據(jù)庫的隔離功能,那為什么我們應該把它放在容器中?
7. 云平臺的不適用性
大部分人通過共有云開始項目。 云簡化了虛擬機操作和替換的復雜性,因此不需要在夜間或周末沒有人工作時間來測試新的硬件環(huán)境。當我們可以迅速啟動一個實例的時候,為什么我們需要擔心這個實例運行的環(huán)境?
這就是為什么我們向云提供商支付很多費用的原因。 當我們?yōu)閷嵗胖脭?shù)據(jù)庫容器時,上面說的這些便利性就不存在了。因為數(shù)據(jù)不匹配,新實例不會與現(xiàn)有的實例兼容,如果要限制實例使用單機服務,應該讓 DB 使用非容器化環(huán)境,我們僅僅需要為計算服務層保留彈性擴展的能力。
這 7 點適用于所有數(shù)據(jù)庫嗎?
也許不是全部,但是應該是一切需要持久化數(shù)據(jù)的數(shù)據(jù)庫,以及所有具有特殊硬件環(huán)境要求的數(shù)據(jù)庫。
如果我們使用 Redis 作為緩存或用戶會話存儲- 使用容器就不應該有任何問題。因為不需要保證該數(shù)據(jù)落地,那么數(shù)據(jù)沒有丟失的風險。但是如果我們考慮使用 Redis 作為一個持久的數(shù)據(jù)存儲,那么你最好把數(shù)據(jù)放在容器外面,即使您不斷刷新 RDB 快照,在快速變化的計算集群中找到這個快照也會很復雜。
我們還可以談談容器內(nèi)的 Elasticsearch。我們可以存儲在 ES 中的索引,并且可以從持久性數(shù)據(jù)源重建它們。但是看看要求!默認情況下,Elasticsearch 需要 2 到 3GB 的內(nèi)存。由于 Java 的 GC,內(nèi)存使用并不一致。您確定Elasticsearch 適合用于資源限制的容器嗎?讓不同的 Elasticsearch 實例使用不同的硬件配置不是更好嗎?
不要擔心本地開發(fā)環(huán)境的數(shù)據(jù)庫容器化。將數(shù)據(jù)庫放在本地環(huán)境的容器中,你將節(jié)省大量的時間和精力。你將能夠復制生產(chǎn)環(huán)境操作系統(tǒng)。原生Postgres for OS X或Windows不是100%兼容Linux版本。在主機操作系統(tǒng)上設置容器而不是軟件包,你會克服這種問題。
結論
Docker 的炒作應該有一天會冷下來。 這并不意味著人們將停止使用容器虛擬化技術,而是說我們在將容器化設計時,需要將其帶來的價值放在首要考量因素。
幾天前我看到了一個關于在零亂的 Ruby 世界中框架如何生存的演講。 從這個演講中我得到的啟發(fā)是技術炒作周期,借用這個炒作周期的說法,我們看到 Docker 目前在第二階段(充滿期望的高峰)太長時間(高可用架構小編:參看資源1),當我們在最后一個階段看到 Docker 時,情況將會正常化。 我認為我們需要對這種過程負責,并應該加快這一進程。