贈(zèng)你13張圖,助你20分鐘打敗了「V8垃圾回收機(jī)制」!!!
前言
大家好,我是林三心。前兩天,無(wú)意中看到了B站上一個(gè)講V8垃圾回收 機(jī)制的視頻,感興趣的我看了一下,感覺(jué)有點(diǎn)難懂,于是我就在想,大家是不是跟我一樣對(duì)V8垃圾回收機(jī)制這方面的知識(shí)都比較懵,或者說(shuō)看過(guò)這方面的知識(shí),但是看不懂。所以,我思考了三天,想了一下如何才能用最通俗的話(huà),講最難的知識(shí)點(diǎn)。
普通理解
我相信大部分同學(xué)在面試中常常被問(wèn)到:”說(shuō)一說(shuō)V8垃圾回收機(jī)制吧“。
這個(gè)時(shí)候,大部分同學(xué)肯定會(huì)這么回答:”垃圾回收機(jī)制有兩種方式,一種是引用法,一種是標(biāo)記法“。
引用法
就是判斷一個(gè)對(duì)象的引用數(shù),引用數(shù)為0就回收,引用數(shù)大于0就不回收。請(qǐng)看以下代碼:
let obj1 = { name: '林三心', age: 22 }
let obj2 = obj1
let obj3 = obj1
obj1 = null
obj2 = null
obj3 = null
圖片
引用法是有缺點(diǎn)的,下面代碼執(zhí)行完后,按理說(shuō)obj1和obj2都會(huì)被回收,但是由于他們互相引用,各自引用數(shù)都是1,所以不會(huì)被回收,從而造成內(nèi)存泄漏。
function fn () {
const obj1 = {}
const obj2 = {}
obj1.a = obj2
obj2.a = obj1
}
fn()
圖片
標(biāo)記法
標(biāo)記法就是,將可達(dá)的對(duì)象標(biāo)記起來(lái),不可達(dá)的對(duì)象當(dāng)成垃圾回收。
那問(wèn)題來(lái)了,可不可達(dá),通過(guò)什么來(lái)判斷呢?(這里的可達(dá),可不是可達(dá)鴨)
言歸正傳,想要判斷可不可達(dá),就不得不說(shuō)可達(dá)性了,可達(dá)性是什么?就是從初始的根對(duì)象(window或者global)的指針開(kāi)始,向下搜索子節(jié)點(diǎn),子節(jié)點(diǎn)被搜索到了,說(shuō)明該子節(jié)點(diǎn)的引用對(duì)象可達(dá),并為其進(jìn)行標(biāo)記,然后接著遞歸搜索,直到所有子節(jié)點(diǎn)被遍歷結(jié)束。那么沒(méi)有被遍歷到節(jié)點(diǎn),也就沒(méi)有被標(biāo)記,也就會(huì)被當(dāng)成沒(méi)有被任何地方引用,就可以證明這是一個(gè)需要被釋放內(nèi)存的對(duì)象,可以被垃圾回收器回收。
// 可達(dá)
var name = '林三心'
var obj = {
arr: [1, 2, 3]
}
console.log(window.name) // 林三心
console.log(window.obj) // { arr: [1, 2, 3] }
console.log(window.obj.arr) // [1, 2, 3]
console.log(window.obj.arr[1]) // 2
function fn () {
var age = 22
}
// 不可達(dá)
console.log(window.age) // undefined
圖片
普通的理解其實(shí)是不夠的,因?yàn)槔厥諜C(jī)制(GC)其實(shí)不止這兩個(gè)算法,想要更深入地了解V8垃圾回收機(jī)制,就繼續(xù)往下看吧!!!
JavaScript內(nèi)存管理
其實(shí)JavaScript內(nèi)存的流程很簡(jiǎn)單,分為3步:
- 1、分配給使用者所需的內(nèi)存
- 2、使用者拿到這些內(nèi)存,并使用內(nèi)存
- 3、使用者不需要這些內(nèi)存了,釋放并歸還給系統(tǒng)
那么這些使用者是誰(shuí)呢?舉個(gè)例子:
var num = ''
var str = '林三心'
var obj = { name: '林三心' }
obj = { name: '林胖子' }
上面這些num,str,obj就是就是使用者,我們都知道,JavaScript數(shù)據(jù)類(lèi)型分為基礎(chǔ)數(shù)據(jù)類(lèi)型和引用數(shù)據(jù)類(lèi)型:
- 基礎(chǔ)數(shù)據(jù)類(lèi)型:擁有固定的大小,值保存在棧內(nèi)存里,可以通過(guò)值直接訪(fǎng)問(wèn)
- 引用數(shù)據(jù)類(lèi)型:大小不固定(可以加屬性),棧內(nèi)存中存著指針,指向堆內(nèi)存中的對(duì)象空間,通過(guò)引用來(lái)訪(fǎng)問(wèn)
圖片
- 由于棧內(nèi)存所存的基礎(chǔ)數(shù)據(jù)類(lèi)型大小是固定的,所以棧內(nèi)存的內(nèi)存都是操作系統(tǒng)自動(dòng)分配和釋放回收的
- 由于堆內(nèi)存所存大小不固定,系統(tǒng)無(wú)法自動(dòng)釋放回收,所以需要JS引擎來(lái)手動(dòng)釋放這些內(nèi)存
為啥要垃圾回收
在Chrome中,V8被限制了內(nèi)存的使用(64位約1.4G/1464MB , 32位約0.7G/732MB),為什么要限制呢?
- 表層原因:V8最初為瀏覽器而設(shè)計(jì),不太可能遇到用大量?jī)?nèi)存的場(chǎng)景
- 深層原因:V8的垃圾回收機(jī)制的限制(如果清理大量的內(nèi)存垃圾是很耗時(shí)間,這樣會(huì)引起JavaScript線(xiàn)程暫停執(zhí)行的時(shí)間,那么性能和應(yīng)用直線(xiàn)下降)
前面說(shuō)到棧內(nèi)的內(nèi)存,操作系統(tǒng)會(huì)自動(dòng)進(jìn)行內(nèi)存分配和內(nèi)存釋放,而堆中的內(nèi)存,由JS引擎(如Chrome的V8)手動(dòng)進(jìn)行釋放,當(dāng)我們的代碼沒(méi)有按照正確的寫(xiě)法時(shí),會(huì)使得JS引擎的垃圾回收機(jī)制無(wú)法正確的對(duì)內(nèi)存進(jìn)行釋放(內(nèi)存泄露),從而使得瀏覽器占用的內(nèi)存不斷增加,進(jìn)而導(dǎo)致JavaScript和應(yīng)用、操作系統(tǒng)性能下降。
V8的垃圾回收算法
1. 分代回收
在JavaScript中,對(duì)象存活周期分為兩種情況
- 存活周期很短:經(jīng)過(guò)一次垃圾回收后,就被釋放回收掉
- 存活周期很長(zhǎng):經(jīng)過(guò)多次垃圾回收后,他還存在,賴(lài)著不走
那么問(wèn)題來(lái)了,對(duì)于存活周期短的,回收掉就算了,但對(duì)于存活周期長(zhǎng)的,多次回收都回收不掉,明知回收不掉,卻還不斷地去做回收無(wú)用功,那豈不是很消耗性能?
對(duì)于這個(gè)問(wèn)題,V8做了分代回收的優(yōu)化方法,通俗點(diǎn)說(shuō)就是:V8將堆分為兩個(gè)空間,一個(gè)叫新生代,一個(gè)叫老生代,新生代是存放存活周期短對(duì)象的地方,老生代是存放存活周期長(zhǎng)對(duì)象的地方。
圖片
新生代通常只有1-8M的容量,而老生代的容量就大很多了。對(duì)于這兩塊區(qū)域,V8分別使用了不同的垃圾回收器和不同的回收算法,以便更高效地實(shí)施垃圾回收。
- 副垃圾回收器 + Scavenge算法:主要負(fù)責(zé)新生代的垃圾回收
- 主垃圾回收器 + Mark-Sweep && Mark-Compact算法:主要負(fù)責(zé)老生代的垃圾回收
1.1 新生代
在JavaScript中,任何對(duì)象的聲明分配到的內(nèi)存,將會(huì)先被放置在新生代中,而因?yàn)榇蟛糠謱?duì)象在內(nèi)存中存活的周期很短,所以需要一個(gè)效率非常高的算法。在新生代中,主要使用Scavenge算法進(jìn)行垃圾回收,Scavenge算法是一個(gè)典型的犧牲空間換取時(shí)間的復(fù)制算法,在占用空間不大的場(chǎng)景上非常適用。
Scavange算法將新生代堆分為兩部分,分別叫from-space和to-space,工作方式也很簡(jiǎn)單,就是將from-space中存活的活動(dòng)對(duì)象復(fù)制到to-space中,并將這些對(duì)象的內(nèi)存有序的排列起來(lái),然后將from-space中的非活動(dòng)對(duì)象的內(nèi)存進(jìn)行釋放,完成之后,將from space 和to space進(jìn)行互換,這樣可以使得新生代中的這兩塊區(qū)域可以重復(fù)利用。
圖片
具體步驟為以下4步:
- 標(biāo)記活動(dòng)對(duì)象和非活動(dòng)對(duì)象
- 復(fù)制from-space的活動(dòng)對(duì)象到to-space中并進(jìn)行排序
- 清除from-space中的非活動(dòng)對(duì)象
- 將from-space和to-space進(jìn)行角色互換,以便下一次的Scavenge算法垃圾回收
那么,垃圾回收器是怎么知道哪些對(duì)象是活動(dòng)對(duì)象,哪些是非活動(dòng)對(duì)象呢?
這就要不得不提一個(gè)東西了——可達(dá)性。什么是可達(dá)性呢?就是從初始的根對(duì)象(window或者global)的指針開(kāi)始,向下搜索子節(jié)點(diǎn),子節(jié)點(diǎn)被搜索到了,說(shuō)明該子節(jié)點(diǎn)的引用對(duì)象可達(dá),并為其進(jìn)行標(biāo)記,然后接著遞歸搜索,直到所有子節(jié)點(diǎn)被遍歷結(jié)束。那么沒(méi)有被遍歷到節(jié)點(diǎn),也就沒(méi)有被標(biāo)記,也就會(huì)被當(dāng)成沒(méi)有被任何地方引用,就可以證明這是一個(gè)需要被釋放內(nèi)存的對(duì)象,可以被垃圾回收器回收。
新生代中的對(duì)象什么時(shí)候變成老生代的對(duì)象?
在新生代中,還進(jìn)一步進(jìn)行了細(xì)分。分為nursery子代和intermediate子代兩個(gè)區(qū)域,一個(gè)對(duì)象第一次分配內(nèi)存時(shí)會(huì)被分配到新生代中的nursery子代,如果經(jīng)過(guò)下一次垃圾回收這個(gè)對(duì)象還存在新生代中,這時(shí)候我們將此對(duì)象移動(dòng)到intermediate子代,在經(jīng)過(guò)下一次垃圾回收,如果這個(gè)對(duì)象還在新生代中,副垃圾回收器會(huì)將該對(duì)象移動(dòng)到老生代中,這個(gè)移動(dòng)的過(guò)程被稱(chēng)為晉升
1.2 老生代
新生代空間的對(duì)象,身經(jīng)百戰(zhàn)之后,留下來(lái)的老對(duì)象,成功晉升到了老生代空間里,由于這些對(duì)象都是經(jīng)過(guò)多次回收過(guò)程但是沒(méi)有被回收走的,都是一群生命力頑強(qiáng),存活率高的對(duì)象,所以老生代里,回收算法不宜使用Scavenge算法,為啥呢,有以下原因:
- Scavenge算法是復(fù)制算法,反復(fù)復(fù)制這些存活率高的對(duì)象,沒(méi)什么意義,效率極低。
- Scavenge算法是以空間換時(shí)間的算法,老生代是內(nèi)存很大的空間,如果使用Scavenge算法,空間資源非常浪費(fèi),得不償失啊。
所以老生代里使用了Mark-Sweep算法(標(biāo)記清理)和Mark-Compact算法(標(biāo)記整理)。
Mark-Sweep(標(biāo)記清理)
Mark-Sweep分為兩個(gè)階段,標(biāo)記和清理階段,之前的Scavenge算法也有標(biāo)記和清理,但是Mark-Sweep算法跟Scavenge算法的區(qū)別是,后者需要復(fù)制后再清理,前者不需要,Mark-Sweep直接標(biāo)記活動(dòng)對(duì)象和非活動(dòng)對(duì)象之后,就直接執(zhí)行清理了。
- 標(biāo)記階段:對(duì)老生代對(duì)象進(jìn)行第一次掃描,對(duì)活動(dòng)對(duì)象進(jìn)行標(biāo)記
- 清理階段:對(duì)老生代對(duì)象進(jìn)行第二次掃描,清除未標(biāo)記的對(duì)象,即非活動(dòng)對(duì)象
圖片
由上圖,我想大家也發(fā)現(xiàn)了,有一個(gè)問(wèn)題:清除非活動(dòng)對(duì)象之后,留下了很多零零散散的空位。
Mark-Compact(標(biāo)記整理)
Mark-Sweep算法執(zhí)行垃圾回收之后,留下了很多零零散散的空位,這有什么壞處呢?如果此時(shí)進(jìn)來(lái)了一個(gè)大對(duì)象,需要對(duì)此對(duì)象分配一個(gè)大內(nèi)存,先從零零散散的空位中找位置,找了一圈,發(fā)現(xiàn)沒(méi)有適合自己大小的空位,只好拼在了最后,這個(gè)尋找空位的過(guò)程是耗性能的,這也是Mark-Sweep算法的一個(gè)缺點(diǎn)。
這個(gè)時(shí)候Mark-Compact算法出現(xiàn)了,他是Mark-Sweep算法的加強(qiáng)版,在Mark-Sweep算法的基礎(chǔ)上,加上了整理階段,每次清理完非活動(dòng)對(duì)象,就會(huì)把剩下的活動(dòng)對(duì)象,整理到內(nèi)存的一側(cè),整理完成后,直接回收掉邊界上的內(nèi)存。
圖片
2. 全停頓(Stop-The-World)
說(shuō)完V8的分代回收,咱們來(lái)聊聊一個(gè)問(wèn)題。JS代碼的運(yùn)行要用到JS引擎,垃圾回收也要用到JS引擎,那如果這兩者同時(shí)進(jìn)行了,發(fā)生沖突了咋辦呢?答案是,垃圾回收優(yōu)先于代碼執(zhí)行,會(huì)先停止代碼的執(zhí)行,等到垃圾回收完畢,再執(zhí)行JS代碼。這個(gè)過(guò)程,稱(chēng)為全停頓。
由于新生代空間小,并且存活對(duì)象少,再配合Scavenge算法,停頓時(shí)間較短。但是老生代就不一樣了,某些情況活動(dòng)對(duì)象比較多的時(shí)候,停頓時(shí)間就會(huì)較長(zhǎng),使得頁(yè)面出現(xiàn)了卡頓現(xiàn)象。
3. Orinoco優(yōu)化
orinoco為V8的垃圾回收器的項(xiàng)目代號(hào),為了提升用戶(hù)體驗(yàn),解決全停頓問(wèn)題,它提出了增量標(biāo)記、懶性清理、并發(fā)、并行的優(yōu)化方法。
3.1 增量標(biāo)記(Incremental marking)
咱們前面不斷強(qiáng)調(diào)了先標(biāo)記,后清除,而增量標(biāo)記就是在標(biāo)記這個(gè)階段進(jìn)行了優(yōu)化。我舉個(gè)生動(dòng)的例子:路上有很多垃圾,害得路人都走不了路,需要清潔工打掃干凈才能走。前幾天路上的垃圾都比較少,所以路人們都等到清潔工全部清理干凈才通過(guò),但是后幾天垃圾越來(lái)越多,清潔工清理的太久了,路人就等不及了,跟清潔工說(shuō):“你打掃一段,我就走一段,這樣效率高”。
大家把上面例子里,清潔工清理垃圾的過(guò)程——標(biāo)記過(guò)程,路人——JS代碼,一一對(duì)應(yīng)就懂了。當(dāng)垃圾少量時(shí)不會(huì)做增量標(biāo)記優(yōu)化,但是當(dāng)垃圾達(dá)到一定數(shù)量時(shí),增量標(biāo)記就會(huì)開(kāi)啟:標(biāo)記一點(diǎn),JS代碼運(yùn)行一段,從而提高效率。
圖片
3.2 惰性清理(Lazy sweeping)
上面說(shuō)了,增量標(biāo)記只是針對(duì)標(biāo)記階段,而惰性清理就是針對(duì)清除階段了。在增量標(biāo)記之后,要進(jìn)行清理非活動(dòng)對(duì)象的時(shí)候,垃圾回收器發(fā)現(xiàn)了其實(shí)就算是不清理,剩余的空間也足以讓JS代碼跑起來(lái),所以就延遲了清理,讓JS代碼先執(zhí)行,或者只清理部分垃圾,而不清理全部。這個(gè)優(yōu)化就叫做惰性清理。
整理標(biāo)記和惰性清理的出現(xiàn),大大改善了全停頓現(xiàn)象。但是問(wèn)題也來(lái)了:增量標(biāo)記是標(biāo)記一點(diǎn),JS運(yùn)行一段,那如果你前腳剛標(biāo)記一個(gè)對(duì)象為活動(dòng)對(duì)象,后腳JS代碼就把此對(duì)象設(shè)置為非活動(dòng)對(duì)象,或者反過(guò)來(lái),前腳沒(méi)有標(biāo)記一個(gè)對(duì)象為活動(dòng)對(duì)象,后腳JS代碼就把此對(duì)象設(shè)置為活動(dòng)對(duì)象。總結(jié)起來(lái)就是:標(biāo)記和代碼執(zhí)行的穿插,有可能造成對(duì)象引用改變,標(biāo)記錯(cuò)誤現(xiàn)象。這就需要使用寫(xiě)屏障技術(shù)來(lái)記錄這些引用關(guān)系的變化。
3.3 并發(fā)(Concurrent)
并發(fā)式GC允許在在垃圾回收的同時(shí)不需要將主線(xiàn)程掛起,兩者可以同時(shí)進(jìn)行,只有在個(gè)別時(shí)候需要短暫停下來(lái)讓垃圾回收器做一些特殊的操作。但是這種方式也要面對(duì)增量回收的問(wèn)題,就是在垃圾回收過(guò)程中,由于JavaScript代碼在執(zhí)行,堆中的對(duì)象的引用關(guān)系隨時(shí)可能會(huì)變化,所以也要進(jìn)行寫(xiě)屏障操作。
圖片
3.4 并行
并行式GC允許主線(xiàn)程和輔助線(xiàn)程同時(shí)執(zhí)行同樣的GC工作,這樣可以讓輔助線(xiàn)程來(lái)分擔(dān)主線(xiàn)程的GC工作,使得垃圾回收所耗費(fèi)的時(shí)間等于總時(shí)間除以參與的線(xiàn)程數(shù)量(加上一些同步開(kāi)銷(xiāo))。
圖片
V8當(dāng)前的垃圾回收機(jī)制
2011年,V8應(yīng)用了增量標(biāo)記機(jī)制。直至2018年,Chrome64和Node.js V10啟動(dòng)并發(fā)標(biāo)記(Concurrent),同時(shí)在并發(fā)的基礎(chǔ)上添加并行(Parallel)技術(shù),使得垃圾回收時(shí)間大幅度縮短。
副垃圾回收器
V8在新生代垃圾回收中,使用并行(parallel)機(jī)制,在整理排序階段,也就是將活動(dòng)對(duì)象從from-to復(fù)制到space-to的時(shí)候,啟用多個(gè)輔助線(xiàn)程,并行的進(jìn)行整理。由于多個(gè)線(xiàn)程競(jìng)爭(zhēng)一個(gè)新生代的堆的內(nèi)存資源,可能出現(xiàn)有某個(gè)活動(dòng)對(duì)象被多個(gè)線(xiàn)程進(jìn)行復(fù)制操作的問(wèn)題,為了解決這個(gè)問(wèn)題,V8在第一個(gè)線(xiàn)程對(duì)活動(dòng)對(duì)象進(jìn)行復(fù)制并且復(fù)制完成后,都必須去維護(hù)復(fù)制這個(gè)活動(dòng)對(duì)象后的指針轉(zhuǎn)發(fā)地址,以便于其他協(xié)助線(xiàn)程可以找到該活動(dòng)對(duì)象后可以判斷該活動(dòng)對(duì)象是否已被復(fù)制。
圖片
主垃圾回收器
V8在老生代垃圾回收中,如果堆中的內(nèi)存大小超過(guò)某個(gè)閾值之后,會(huì)啟用并發(fā)(Concurrent)標(biāo)記任務(wù)。每個(gè)輔助線(xiàn)程都會(huì)去追蹤每個(gè)標(biāo)記到的對(duì)象的指針以及對(duì)這個(gè)對(duì)象的引用,而在JavaScript代碼執(zhí)行時(shí)候,并發(fā)標(biāo)記也在后臺(tái)的輔助進(jìn)程中進(jìn)行,當(dāng)堆中的某個(gè)對(duì)象指針被JavaScript代碼修改的時(shí)候,寫(xiě)入屏障(write barriers)技術(shù)會(huì)在輔助線(xiàn)程在進(jìn)行并發(fā)標(biāo)記的時(shí)候進(jìn)行追蹤。
當(dāng)并發(fā)標(biāo)記完成或者動(dòng)態(tài)分配的內(nèi)存到達(dá)極限的時(shí)候,主線(xiàn)程會(huì)執(zhí)行最終的快速標(biāo)記步驟,這個(gè)時(shí)候主線(xiàn)程會(huì)掛起,主線(xiàn)程會(huì)再一次的掃描根集以確保所有的對(duì)象都完成了標(biāo)記,由于輔助線(xiàn)程已經(jīng)標(biāo)記過(guò)活動(dòng)對(duì)象,主線(xiàn)程的本次掃描只是進(jìn)行check操作,確認(rèn)完成之后,某些輔助線(xiàn)程會(huì)進(jìn)行清理內(nèi)存操作,某些輔助進(jìn)程會(huì)進(jìn)行內(nèi)存整理操作,由于都是并發(fā)的,并不會(huì)影響主線(xiàn)程JavaScript代碼的執(zhí)行。
圖片
結(jié)語(yǔ)
讀懂了這篇文章,下次面試官問(wèn)你的時(shí)候,你就可以不用傻乎乎地說(shuō):“引用法和標(biāo)記法”。而是可以更全面地,更細(xì)致地征服面試官了。