String 的不可變真的是因為 Final 嗎?
本文轉載自微信公眾號「飛天小牛肉」,作者飛天小牛肉。轉載本文請聯系飛天小牛肉公眾號。
String 為啥不可變?因為 String 中的 char 數組被 final 修飾。這套回答相信各位已經背爛了,But 這并不正確!
- 面試官:講講 String、StringBuilder、StringBuffer 的區別
- 我:String 不可變,而 StringBuilder 和 StringBuffer 可變,叭叭叭 ......
- 面試官:String 為什么不可變?
- 我:String 被 final 修飾,這說明 String 不可繼承;并且String 中真正存儲字符的地方是 char 數組,這個數組被 final 修飾,所以 String 不可變
- 面試官:String 的不可變真的是因為 final 嗎?
- 我:是.....是的吧
- 面試官:OK,你這邊還有什么問題嗎?
- 我:卒......
什么是不可變?
《Effective Java》中對于不可變對象(Immutable Object)的定義是:對象一旦被創建后,對象所有的狀態及屬性在其生命周期內不會發生任何變化。這就意味著,一旦我們將一個對象分配給一個變量,就無法再通過任何方式更改對象的狀態了。
String 不可變的表現就是當我們試圖對一個已有的對象 "abcd" 賦值為 "abcde",String 會新創建一個對象:
String 為什么不可變?
String 用 final 修飾 char 數組,這個數組無法被修改,這么說確實沒啥問題。
但是!!!這個無法被修改僅僅是指引用地址不可被修改(也就是說棧里面的這個叫 value 的引用地址不可變,編譯器不允許我們把 value 指向堆中的另一個地址),并不代表存儲在堆中的這個數組本身的內容不可變。舉個例子:
如果我們直接修改數組中的元素,是完全 OK 的:
那既然我們說 String 是不可變的,那顯然僅僅靠 final 是遠遠不夠的:
1)首先,char 數組是 private 的,并且 String 類沒有對外提供修改這個數組的方法,所以它初始化之后外界沒有有效的手段去改變它;
2)其次,String 類被 final 修飾的,也就是不可繼承,避免被他人繼承后破壞;
3)最重要的!是因為 Java 作者在 String 的所有方法里面,都很小心地避免去修改了 char 數組中的數據,涉及到對 char 數組中數據進行修改的操作全部都會重新創建一個 String 對象。你可以隨便翻個源碼看看來驗證這個說法,比如 substring 方法:
為什么要設計成不可變的呢?
1)首先,字符串常量池的需要。
我們來回顧一下字符串常量池的定義:大量頻繁的創建字符串,將會極大程度的影響程序的性能。為此,JVM 為了提高性能和減少內存開銷,在實例化字符串常量的時候進行了一些優化:
- 為字符串開辟了一個字符串常量池 String Pool,可以理解為緩存區
- 創建字符串常量時,首先檢查字符串常量池中是否存在該字符串
- 若字符串常量池中存在該字符串,則直接返回該引用實例,無需重新實例化;若不存在,則實例化該字符串并放入池中。
如下面的代碼所示,堆內存中只會創建一個 String 對象:
- String str1 = "hello";
- String str2 = "hello";
- System.out.println(str1 == str2) // true
假設 String 允許被改變,那如果我們修改了 str2 的內容為 good,那么 str1 也會被修改,顯然這不是我們想要看見的結果。
2)另外一點也比較容易想到,String 被設計成不可變就是為了安全。
作為最基礎最常用的數據類型,String 被許多 Java 類庫用來作為參數,如果 String 不是固定不變的,將會引起各種安全隱患。
舉個例子,我們來看看將可變的字符串 StringBuilder 存入 HashSet 的場景:
我們把可變字符串 s3 指向了 s1 的地址,然后改變 s3 的值,由于 StringBuilder 沒有像String 那樣設計成不可變的,所以 s3 就會直接在 s1 的地址上進行修改,導致 s1 的值也發生了改變。于是,糟糕的事情發生了,HashSet 中出現了兩個相等的元素,破壞了 HashSet 的不包含重復元素的原則。
另外,在多線程環境下,眾所周知,多個線程同時想要修改同一個資源,是存在危險的,而String 作為不可變對象,不能被修改,并且多個線程同時讀同一個資源,是完全沒有問題的,所以 String 是線程安全的。
String 真的不可變嗎?
想要改變 String 無非就是改變 char 數組 value 的內容,而 value 是私有屬性,那么在 Java 中有沒有某種手段可以訪問類的私有屬性呢?
沒錯,就是反射,使用反射可以直接修改 char 數組中的內容,當然,一般來說我們不這么做。
看下面代碼:
總結
總結來說,并不是因為 char 數組是 final 才導致 String 的不可變,而是為了把 String 設計成不可變才把 char 數組設置為 final 的。下面是一些創建不可變對象的簡單策略,當然,也并非所有不可變類都完全遵守這些規則:
- 不要提供 setter 方法(包括修改字段的方法和修改字段引用對象的方法);
- 將類的所有字段定義為 final、private 的;
- 不允許子類重寫方法。簡單的辦法是將類聲明為 final,更好的方法是將構造函數聲明為私有的,通過工廠方法創建對象;
- 如果類的字段是對可變對象的引用,不允許修改被引用對象。