奇怪,為什么ArrayList初始化容量大小為10?
看ArrayList源碼時,無意中看到ArrayList的初始化容量大小為10,這就奇怪了!我們都知道ArrayList和HashMap底層都是基于數組的,但為什么ArrayList不像用HashMap那樣用16作為初始容量大小,而是采用10呢?
于是各方查找資料,求證了這個問題,這篇文章就給大家講講。
為什么HashMap的初始化容量為16?
在聊ArrayList的初始化容量時,要先來回顧一下HashMap的初始化容量。這里以Java 8源碼為例,HashMap中的相關因素有兩個:初始化容量及裝載因子:
/**
* The default initial capacity - MUST be a power of two.
*/
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
/**
* The load factor used when none specified in constructor.
*/
static final float DEFAULT_LOAD_FACTOR = 0.75f;
在HashMap當中,數組的默認初始化容量為16,當數據填充到默認容量的0.75時,就會進行2倍擴容。當然,使用者也可以在初始化時傳入指定大小。但需要注意的是,最好是2的n次方的數值,如果未設置為2的n次方,HashMap也會將其轉化,反而多了一步操作。
關于HashMap的實現原理的內容,這里就不再贅述,網絡上已經有太多文章講這個了。有一點我們需要知道的是HashMap計算Key值坐標的算法,也就是通過對Key值進行Hash,進而映射到數組中的坐標。
此時,保證HashMap的容量是2的n次方,那么在hash運算時就可以采用位運行直接對內存進行操作,無需轉換成十進制,效率會更高。
通常,可以認為,HashMap之所以采用2的n次方,同時默認值為16,有以下方面的考量:
- 減少hash碰撞;
- 提高Map查詢效率;
- 分配過小防止頻繁擴容;
- 分配過大浪費資源;
總之,HashMap之所以采用16作為默認值,是為了減少hash碰撞,同時提升效率。
ArrayList的初始化容量是10嗎?
下面,先來確認一下ArrayList的初始化容量是不是10,然后在討論為什么是這個值。
先來看看Java 8中,ArrayList初始化容量的源碼:
/**
* Default initial capacity.
*/
private static final int DEFAULT_CAPACITY = 10;
很明顯,默認的容器初始化值為10。而且從JDK1.2到JDK1.6,這個值也始終都為10。
從JDK1.7開始,在初始化ArrayList的時候,默認值初始化為空數組:
/**
* Shared empty array instance used for default sized empty instances. We
* distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when
* first element is added.
*/
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
/**
* Constructs an empty list with an initial capacity of ten.
*/
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
此處肯定有朋友說,Java 8中ArrayList默認初始化大小為0,不是10。而且還會發現構造方法上的注釋有一些奇怪:構造一個初始容量10的空列表。什么鬼?明明是空的啊!
保留疑問,先來看一下ArrayList的add方法:
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
在add方法中調用了ensureCapacityInternal方法,進入該方法一開始是一個空容器所以size=0?傳入的minCapacity=1:
private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
上述方法中先通過calculateCapacity來計算容量:
private static int calculateCapacity(Object[] elementData, int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}
會發現minCapacity?被重新賦值為10 (DEFAULT_CAPACITY=10?),傳入ensureExplicitCapacity(minCapacity);這minCapacity=10,下面是方法體:
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
上述代碼中grow方法是用來處理擴容的,將容量擴容為原來的1.5倍。
了解上面的處理流程,我們會發現,本質上ArrayList的初始化容量還是10,只不過使用懶加載而已,這是Java 8為了節省內存而進行的優化而已。所以,自始至終,ArrayList的初始化容量都是10。
這里再多提一下懶加載的好處,當有成千上萬的ArrayList存在程序當中,10個對象的默認大小意味著在創建時為底層數組分配10個指針(40 或80字節)并用空值填充它們,一個空數組(用空值填充)占用大量內存。如果能夠延遲初始化數組,那么就能夠節省大量的內存空間。Java 8的改動就是出于上述目的。
為什么ArrayList的初始化容量為10?
最后,我們來探討一下為什么ArrayList的初始化容量為10。其實,可以說沒有為什么,就是“感覺”10挺好的,不大不小,剛剛好,眼緣!
首先,在討論HashMap的時候,我們說到HashMap之所以選擇2的n次方,更多的是考慮到hash算法的性能與碰撞等問題。這個問題對于ArrayList的來說并不存在。ArrayList只是一個簡單的增長陣列,不用考慮算法層面的優化。只要超過一定的值,進行增長即可。所以,理論上來講ArrayList的容量是任何正值即可。
ArrayList的文檔中并沒有說明為什么選擇10,但很大的可能是出于性能損失與空間損失之間的最佳匹配考量。10,不是很大,也不是很小,不會浪費太多的內存空間,也不會折損太多性能。
如果非要問當初到底為什么選擇10,可能只有問問這段代碼的作者“Josh Bloch”了吧。
如果你仔細觀察,還會發現一些其他有意思的初始化容量數字:
ArrayList-10
Vector-10
HashSet-16
HashMap-16
HashTable-11
ArrayList與Vector初始化容量一樣,為10;HashSet、HashMap初始化容量一樣,為16;而HashTable獨獨使用11,又是一個很有意思的問題。
小結
有很多問題是沒有明確原因、明確的答案的。就好像一個女孩兒對你沒感覺,可能是因為你不夠好,也可能是她已經愛上別人了,但也有很大可能你是不會知道答案。但在尋找原因和答案的過程中,還是能夠學到很多,成長很多的。沒有對比就沒有傷害,比如HashMap與ArrayList的對比,沒有對比就不知道是否適合,還比如HashMap與ArrayList。當然,你還可以試試特立獨行的HashTable,或許適合你呢。