大話快評 | Docker被禁,Oracle還遠嗎?
警告:如果您是被列入美國政府禁令名單中的個人及實體公司,將不得使用此服務。

△via:docker.Inc
2020 年 8 月 13 日,Docker.Inc 更新了服務條款的內容,提示如果在美國制裁清單上的個人或實體公司,可能無法使用 Docker 的產品服務。
Docker 服務禁令生效,讓信仰科技無國界的一大批人士失望不已。中國云市場特別是私有云市場,或將與伴隨這個酷暑的洪澇災害一樣,迎來洪水猛獸——受禁令影響,華為、科大訊飛、海康威視、大華股份、商湯、依圖、曠視、360 公司、烽火、中科曙光、海光等中國科技公司不能使用 Docker 商業版。
Docker 是一個開源的應用容器引擎,讓開發者可以打包他們的應用以及依賴包到一個可移植的鏡像中,然后發布到任何流行的 Linux 或 Windows 機器上,也可以實現虛擬化。容器是完全使用沙箱機制,相互之間不會有任何接口。

△Docker應用場景(via:docker.Inc)
Docker 的應用廣泛,在云計算中,可以實現虛擬化應用,但是與 VMware(一家主流的美國收費虛擬化軟件)類似的虛擬機相比,它比虛擬機更節省內存,啟動更快(虛擬機分鐘級啟動,Docker 是毫秒級啟動)。

△Docker與虛擬機架構比較(via:docker.Inc)
一個更為形象的比喻是,如果把物理服務器比作碼頭,擁有場地和各種設備,那么服務器虛擬化就好比碼頭上的倉庫,擁有獨立空間堆放各種貨物或集裝箱;Docker容器就像是一個個的集裝箱,可以將各種貨物打包。
幸運的是,Docker 分商業版和開源版,開源版免費不受限制,禁令一出,將迫使包括中國在內的關聯科技公司轉向開源的 Docker 軟件或其他開源軟件。
受家長管制,Docker 不帶你玩是小事,問題是其他美國科技公司如果也被家長管制,譬如 Oracle 數據庫或 VMware 虛擬化平臺,這些卡脖子技術和產品也不帶你玩,可能就更難了。
這不是危言聳聽。2019 年 9 月 26 日,Oracle 公司就致函委內瑞拉的合作伙伴,聲稱它將再也無法與它們合作,以遵守特朗普總統簽署的 13884 號行政命令。
同樣是為了遵守 13884 號行政命令,Adobe 公司也發布了一份用戶支持文件,公司將從 10 月 28 日起停用委內瑞拉的所有帳戶。
這與今年 6 月美國禁止包括哈工大在內的中國 13 所高校使用 MATLAB 軟件如出一轍。
如果誕生于 1977 年的 Oracle 數據庫也出了與 Docker 類似的公告,對于受制裁的中國企業用戶而言,不得不應對新一輪的技術截殺。
先來看看 Oracle 數據庫在行業的地位。作為穩定的關系型數據庫的鼻祖,Oracle 數據庫在金融、醫療及其他行業的財務領域,都有廣泛的應用,可以這么說,世界上幾乎所有行業都在應用 Oracle 數據庫產品和技術。
作為 Oracle 公司創始人和靈魂人物,拉里·埃里森 (Larry Ellison) 曾在 2018 年發表令人擔憂的言論:如果就這么讓中國經濟超越我們,讓中國培養出比我們更多的工程師,讓中國科技公司擊敗我們的科技公司,那我們就離軍事科技也落后的那天不遠了。美國與中國的激烈競爭中,我站美國隊。
幸運的是,在國產化數據庫替代 Oracle 方面,雖然在性能、成熟度方面還有差距,但是國產數據庫可用、能用,是目前行業的普遍觀點。當我們不得不面對殘酷的技術截殺時,數據庫替換和數據遷移又是一場令 CIO 焦頭爛額的事情。
與數據庫產品一樣,針對 Oracle 數據庫的數據同步和遷移工具,也主要掌握在 Oracle 公司手中。此時若要將原先存儲在 Oracle 數據庫的業務數據,遷移到國產化數據庫或其他數據庫中,除了市場上 MySQL、SQL、Python 等遷移工具(如果沒有被禁),還有就是國產化數據庫遷移工具。
雖不似 Oracle 數據庫產品那樣需要綜合全面的技術,但數據庫遷移工具還是要面對以下問題:
- 數據庫異構平臺選擇問題
- 數據庫操作人員專業性問題
- 數據庫數據遷移后可用性問題
- 數據庫實時增量數據的遷移問題
- 數據庫數據遷移后完整性檢查問題
- 數據遷移過程中對源端性能影響問題
解決數據庫遷移的問題是一個基本需求,在大數據應用日趨完善的今天,從數據庫中抽取關鍵業務數據到大數據平臺,為業務部門提供可參考的決策報表數據,才是凸顯其商業價值的關鍵,下面以網上的一個例子說明:

△數據從 Oracle 到 Kudu 的過程
上圖是數據庫 Oracle 到大數據倉 Kudu 的數據抽取→轉換→轉載的過程,先通過數據庫復制產品 i2Active 將源端數據庫的結構化數據解析、提取后,通過 i2Stream 進行對接、轉換,并發送給消息隊列,最終寫入 HDFS。在此基礎上將數據同步到 Kudu/HBas 等數據倉庫。
這種應用普遍的場景,就是幫助證券、銀行、支付平臺等實現數據從數據庫傳輸到大數據平臺,然后再由用戶根據業務需要,轉換成各類報表數據,為各類商業智能 (BI) 項目服務。
譬如,電商平臺可以通過用戶數據,精準提取用戶畫像的數據標簽,將這些帶標簽的數據傳輸到大數據平臺,通過報表數據,精準獲取某一特定消費人群的消費喜好、載體和支付方式,營銷部門就可以定向進行廣告投放和促銷引導。
這種大數據應用技術,向我們展示了數據的強大應用價值。而當數據成為一種可被精準利用的生產資料時,將極大提升我們的商業競爭力和國防軍隊的實戰能力。
這或許是國內科技公司被技術封鎖的真正原因。