你知道為什么序列化要寫serialVersionUID嗎?
?前言
java中的序列化可能大家像我一樣都停留在實現(xiàn)Serializable?接口上,對于它里面的一些核心機制沒有深入了解過。直到最近在項目中踩了一個坑,就是序列化對象添加一個字段以后,使用方系統(tǒng)報了反序列化失敗,原因是我們雙方的序列化對象沒有加上serialVersionUID,那你們知道下面幾個問題嗎:
- 序列化對象中的serialVersionUID 是干嘛用的?
- 如何修改默認(rèn)的序列化機制?
- 如何使用序列化的方式克隆對象?
對象序列化和反序列化機制
序列化: 將對象轉(zhuǎn)成二進制寫到輸出流的過程。
反序列化: 通過輸入流讀回二進制轉(zhuǎn)成對象的過程。
通過對象的序列化和反序列化機制可以實現(xiàn)對象在網(wǎng)絡(luò)之間傳輸。
在Java中,如果一個對象要想實現(xiàn)序列化,必須要實現(xiàn)下面兩個接口之一:
- Serializable 接口
- Externalizable 接口
這里我們先講解常用的Serializable 接口。
writeObject序列化過程栗子:
結(jié)果:
readObject反序列化栗子:
現(xiàn)在模擬另外一個系統(tǒng)需要反序列化user.dat
如果User類不實現(xiàn)Serializable接口, 那會怎么樣?
當(dāng)然是報錯了,如下圖:
小結(jié):
一個對象想要被序列化,那么它的類就要實現(xiàn)此接口或者它的子接口。
修改默認(rèn)的序列化機制
默認(rèn)的情況下,如果實現(xiàn)了Serializable接口的對象進行序列化的時候,默認(rèn)會將全部的數(shù)據(jù)域,也就是成員變量進行序列化輸出,那往往有時候并不需要這樣,有什么方法可以修改序列化機制呢?下面提供3種方式。
使用transient關(guān)鍵字
將成員變量標(biāo)記成transient,那么在序列化的過程中這些數(shù)據(jù)域會被跳過,如下圖所示:
這是一種最簡單的方式,但是不夠靈活。
自定義readObject、writeObject方法
序列化類中可以通過定義下面簽名的方法:
- private void readObject(java.io.ObjectInputStream s) throws java.io.IOException, ClassNotFoundException
- private void writeObject(java.io.ObjectOutputStream s) throws java.io.IOException
只要類中有這兩個簽名的方法,那么就不會調(diào)用默認(rèn)的序列化,取而代之調(diào)用這些方法。
本例我們舉個jdk中的例子,ArrayList就實現(xiàn)了這兩個方法,重寫了序列化機制。
主要原因ArrayList底層的數(shù)組通常會預(yù)留一些容量,等容量不足時再擴充容量,那么有些空間可能就沒有實際存儲元素,采用自定義方式實現(xiàn)序列化時,就可以保證只序列化實際存儲的那些元素,而不是整個數(shù)組,從而節(jié)省空間和時間。
實現(xiàn)Externalizable接口
Externalizable?接口想必大家很少用到,它是Serializable?接口的子類,用戶要實現(xiàn)的writeExternal()和readExternal() 方法,用來決定如何序列化和反序列化。
因為序列化和反序列化方法需要自己實現(xiàn),因此可以指定序列化哪些屬性,而transient在這里無效。
對Externalizable?對象反序列化時,會先調(diào)用類的無參構(gòu)造方法,這是有別于默認(rèn)反序列方式的。如果把類的不帶參數(shù)的構(gòu)造方法刪除,或者把該構(gòu)造方法的訪問權(quán)限設(shè)置為private?、默認(rèn)或protected?級別,會拋出java.io.InvalidException: no valid constructor?異常,因此Externalizable?對象必須有默認(rèn)構(gòu)造函數(shù),而且必需是public的。
舉例說明:
serialVersionUID的作用
這就回到概述中提到的項目中遇到的問題,現(xiàn)在簡要描述下:
A系統(tǒng)中的序列化對象User用的最新版本如下:
B系統(tǒng)中反序列化的對象,還是老的User版本如下:
這時候A系統(tǒng)生成的序列化文件,交給B系統(tǒng)反序列化時,出錯了, 如下圖:
原因:
類定義發(fā)生了變化,比如添加、刪除、修改類中的數(shù)據(jù)域后,它的唯一標(biāo)記符或者稱為SHA指紋、或者理解為serialVersionUID都會發(fā)生變化,這個值會保存在序列化二進制中,如果反序列化過程發(fā)現(xiàn)對不上,就會報錯,如上圖所示。
那么如何處理呢?
這時候,我們?nèi)绻X得這個序列化對象是可以兼容的,那么可以自定義一個serialVersionUID的靜態(tài)成員變量,它就不會自動生成,而是直接用這個值,如下圖:
使用序列化clone
clone大家都知道吧,在深拷貝的時候編碼還是很麻煩的,借用序列化機制可以實現(xiàn)深拷貝。做法很簡單,就是將對象序列化到輸出流中,然后讀回。
注意一點,這種方式性能不高,通常比顯示構(gòu)建、復(fù)制數(shù)據(jù)要慢不少。
總結(jié)
本文講解了序列化的一些核心機制,不再簡簡單單的停留在序列化就是實現(xiàn)Serializable接口了,希望能幫助到大家。