高德面試:為什么Map不能插入Null?
在 Java 中,Map 是屬于 java.util 包下的一個接口(interface),所以說“為什么 Map 不能插入 null?”這個問題本身問的不嚴謹。Map 部分類關系圖如下:
所以,這里面試官其實想問的是:為什么 ConcurrentHashMap 不能插入 null?
1.HashMap和ConcurrentHashMap的區別
HashMap 和 ConcurrentHashMap 在對待 null 的態度上是不同的,在 Java 中,HashMap 是允許 key 和 value 值都為 null 的,如下代碼所示:
HashMap<String, Object> map = new HashMap();
map.put(null, null);
if (map.containsKey(null)) {
System.out.println("存在 null");
} else {
System.out.println("不存在 null");
}
以上程序的執行結果如下:
“存在 null
從上述結果可以看出,HashMap 是允許 key 和 value 值都為 null 的。
但 ConcurrentHashMap 就不同了,它不但 key 不能為 null,而且 value 也不能為 null,如以下代碼所示:
ConcurrentHashMap<String, String> concurrentHashMap = new ConcurrentHashMap();
concurrentHashMap.put(null, "javacn.site");
System.out.println(concurrentHashMap.get(null));
在運行以上程序時就會報錯,如下圖所示:
當然,當你為 ConcurrentHashMap 的 value 值設置 null 時也會報錯,如下代碼所示:
String key = "www.avacn.site";
ConcurrentHashMap<String, String> concurrentHashMap = new ConcurrentHashMap();
concurrentHashMap.put(key, null);
System.out.println(concurrentHashMap.get(key));
在運行以上程序時就會報錯,如下圖所示:
因此,我們可以得出結論:
- 在 HashMap 中,key 和 value 值都可以為 null。
- 在 ConcurrentHashMap 中,key 或者是 value 值都不能為 null。
2.為什么不能插入null?
如果我們查看 ConcurrentHashMap 的源碼,就能發現為什么 ConcurrentHashMap 不能插入 null 了,以下是 ConcurrentHashMap 添加元素時的部分核心源碼:
// 添加 key 和 value
public V put(K key, V value) {
return putVal(key, value, false);
}
final V putVal(K key, V value, boolean onlyIfAbsent) {
// 如果 key 或 value 為 null 的話直接拋出空指針異常
if (key == null || value == null) throw new NullPointerException();
int hash = spread(key.hashCode());
int binCount = 0;
// 忽略其他代碼......
}
從上述 ConcurrentHashMap 添加元素的第一行源碼就可以看出,當 key 或 value 為 null 時,會直接拋出空指針異常,這就是 ConcurrentHashMap 之所以不能插入 null 的根本原因了,因為源碼就是這樣設計的。
3.更深層次的原因
那么問題來了,為什么 ConcurrentHashMap 的實現源碼中,不允許為 key 或者是 value 設置 null 呢?
這就要從 ConcurrentHashMap 的使用場景說起了,在 Java 中,ConcurrentHashMap 是用于并發環境中執行的線程安全的容器,而 HashMap 是用于單線程環境下執行的非線程安全的容器,而并發環境下的運行更復雜,如果我們允許 ConcurrentHashMap 的 key 或者是 value 為 null 的情況下,就會存在經典的“二義性問題”。
(1)什么是二義性問題?
所謂的二義性問題指的是代碼或表達式存在多種理解或解釋,導致程序的含義不明確或模糊。
以 ConcurrentHashMap 不允許為 null 的二義性問題來說,null 其實有以下兩層含義:
- 這個值本身設置的是 null,null 在這里表示的是一種具體的“null”值狀態。
- null 還表示“沒有”的意思,因為沒有設置,所以啥也沒有。
所以,如果 ConcurrentHashMap 允許插入 null 值,那么就會存在二義性問題。
那就有同學會問了,為什么 HashMap 允許插入 null,它就不怕有二義性問題嗎?
(2)可證偽的HashMap
HashMap 之所以不怕二義性問題的原因是,HashMap 的設計是給單線程使用的,而單線程下的二義性問題是能被證明真偽的,所以也就不存在二義性問題了(能被證明的問題就不是二義性問題)。
例如,當我們給 HashMap 的 key 設置為 null 時,我們可以通過 hashMap.containsKey(key) 的方法來區分這個 null 值到底是存入的 null?還是壓根不存在的 null?這樣二義性問題就得到了解決,所以 HashMap 的二義性問題可被證明真偽,所以就不怕二義性問題,因此也就可以給 key 或者 value 設置 null 了。
(3)不可證偽的ConcurrentHashMap
而 ConcurrentHashMap 就不一樣了,因為 ConcurrentHashMap 是設計在多線程下使用的,而多線程下的二義性問題是不能被證明真偽的,所以二義性問題是真實存在的。
因為在你在證明二義性問題的同時,可能會有另一個線程影響你的執行結果,所以它的二義性問題就一直存在。
例如,當 ConcurrentHashMap 未設置 key 為 null 時,會有這樣一個場景,當一個線程 A 調用了 concurrentHashMap.containsKey(key),我們期望返回的結果是 false,但在我們調用 concurrentHashMap.containsKey(key) 之后,未返回結果之前,線程 B 又調用了 concurrentHashMap.put(key,null) 存入了 null 值,那么線程 A 最終返回的結果就是 true 了,這個結果和我們之前預想的 false 完全不一樣,這就是不能被證偽的二義性問題。
所以說,多線程的執行比較復雜,在多線程下 null 的二義性問題是不能被證明真偽的(因為在一個線程執行驗證時,可能會有另一個線程改動結果,造成結果不準確),所以 ConcurrentHashMap 為了避免這個二義性問題,所以就在源碼中禁用了 null 值作為 key 或 value。