兩個小技巧提升Docker鏡像構建性能,效率翻倍!
和大多數(shù)公司一樣,我們?yōu)楫a品中使用的所有組件構建Docker鏡像。隨著時間的推移,其中一些鏡像變得越來越大,同時持續(xù)集成(CI)構建也變得越來越長。我的目標是讓CI構建時間不超過5分鐘。
生產力下降的原因如下:
- 開發(fā)人員需要等待構建完成,從而浪費時間。
- 開發(fā)人員開始著手新任務,并需要稍后返回。這需要進行更多的上下文切換,通常也會導致效率低下。
在本文中,我們應用了兩個小的改進,使得構建時間大幅度提高。在介紹兩個改進之前,首先確保你已經遵循了編寫Dockerfile的最佳實踐,例如:
- 盡量減少層數(shù)
- 使用多階段構建
- 使用最小基礎鏡像
- ……
Buildkit和Buildx
讓我們解釋一下Buildkit和Buildx,因為這兩個術語經常被互換使用,但它們并不是完全相同的。在撰寫本文之前,我也沒有完全理解兩者之間的區(qū)別。
Buildkit
Buildkit是改進后的后端,用于取代傳統(tǒng)的Docker構建器。從2018年開始,它與Docker一起打包,并在docker引擎23.0中成為默認構建器。
Buildkit提供了許多實用的功能:
- 緩存能力改進
- 不同層并行構建
- 延遲拉取基礎鏡像(≥ Buildkit 0.9)
使用Buildkit時,你應該會注意到docker build命令的輸出看起來更干凈、更有結構。
在Docker版本低于23.0的情況下,使用Buildkit的典型方法是按照以下方式設置Buildkit參數(shù):
`--build-arg BUILDKIT_INLINE_CACHE=1`
這將啟用內聯(lián)緩存,可以顯著加快構建過程。但是,這在Docker版本低于23.0的情況下不可用。
DOCKER_BUILDKIT=1 docker build --platform linux/amd64 . -t someImage:someVersion
DOCKER_BUILDKIT=1 docker push someImage:someVersion
Buildx
Buildx是Docker的一個插件,它讓你能夠充分利用Buildkit在Docker中的能力。它之所以被創(chuàng)建,是因為Buildkit支持許多新的配置選項,這些選項無法以向后兼容的方式全部集成到docker build命令中。
除了構建鏡像之外,Buildx還支持管理多個構建器。這在持續(xù)集成中非常有用,可以定義范圍明確且具有不同配置的環(huán)境,因為它們不會修改共享的Docker守護進程。
可以按照以下步驟開始使用Buildx:
docker buildx create --bootstrap --name builder
docker buildx use builder
一、從遠程緩存中受益
加快構建速度的第一個方法是將鏡像緩存在遠程注冊表中。這樣,即使在不同的機器上執(zhí)行構建時(例如CI中的常見情況),仍然可以從構建緩存中受益。大多數(shù)人在構建新版本的鏡像之前會拉取最新版本的鏡像。這樣做的好處是可以緩存未更改的層,但代價是最初需要拉取完整的鏡像。拉取完整鏡像可能需要一些時間,而且也不能保證可以重用這些層。使用以下命令進行說明:
docker pull someImage:latest || true
docker build --platform linux/amd64 . \
-t someImage:someVersion \
-f Dockerfile \
--cache-from someImage:latest
使用 Buildx,可以將緩存信息存儲在遠程位置(例如容器注冊表、blob 存儲等)。構建器會檢查給定的層是否已經存在,如果存在,它將重用該層而不是重新創(chuàng)建它。甚至無需將層拉取到本地即可實現(xiàn)此功能。如下所示:
docker buildx build --platform linux/amd64 . \
-t someImage:someVersion - push \
--cache-to type=registry,ref=someCachedImage:someVersion,mode=max
--cache-from type=registry,ref=someCachedImage:someVersion
模式“max”表示我們將為每個層存儲構建信息,即使這些層在最終的鏡像中未被使用(例如在使用多階段構建時)。默認情況下,使用模式“min”,它僅存儲關于最終鏡像中存在的層的構建信息。
緩存存在一個特殊情況是將緩存數(shù)據(jù)“內聯(lián)”存儲,這意味著它將與鏡像一起緩存。在使用Buildkit沒有使用Buildx時也支持此選項。但在使用多階段構建時會更具挑戰(zhàn)性,并且它無法清晰地區(qū)分構建產物的輸出和緩存。緩存數(shù)據(jù)“內聯(lián)”存儲的命令如下所示:
docker buildx build - platform linux/amd64 . \
-t someImage:someVersion --push \
--cache-to type=inline,mode=max \
--cache-from someImage:somePreviousVersion
二、添加文件到鏡像的新方法
Docker推出了新版本的Dockerfile語法,即#syntax=docker/dockerfile:1.4。它支持COPY和ADD命令的額外鏈接選項。
以前,當使用COPY或ADD命令時,構建器會創(chuàng)建一個新的快照,將新文件與已存在的文件系統(tǒng)合并。結果是,在執(zhí)行此操作之前,父層都需要存在,不然的話目標目錄可能還不存在。最終的鏡像(構建命令的結果)將由每個層的tarball組成,其中包含相應快照之間的差異。
FROM baseImage:version
COPY binary /opt/
使用鏈接選項時,新文件將放入自己的快照中,而不會依賴于先前的層。鏈接的文件存儲在自己的tarball中,并且不同的tarball相互鏈接在一起,而不會依賴于現(xiàn)有的文件系統(tǒng),如下圖所示。
# syntax=docker/dockerfile:1.4
FROM baseImage:version
COPY [--chown=<user>:<group>] [--chmod=<perms>] --link binary /opt/
主要的優(yōu)勢是文件不再依賴于先前的層。只要文件沒有改變,即使父層發(fā)生了更改,該層也可以重復使用。
并且還可以提高構建速度,因為現(xiàn)在可以并行執(zhí)行多個層復制數(shù)據(jù)的操作。
結論
通過上述兩種方式,我們將鏡像構建速度提升了 1 倍。