MD5 到底是不是加密?
今天想跟大家談談:「MD5 到底是加密的嗎?」
MD5 是程序開發中非常常用的一種算法,很多人都用過。提到 MD5,大多數人的反應都是「這是一種加密算法」,懂得多點的人還會說「可以用于給密碼加密」,再懂點的還知道「MD5 已經有被破解的可能性了」。但 MD5 到底是加密嗎?所謂的加密到底是什么意思?MD5 的破解又是指的什么?
MD5:一種哈希算法
實質上,MD5 只是一種哈希算法。
哈希算法,即 hash,又叫散列算法,是一類把任意數據轉換為定長(或限制長度)數據的算法統稱。例如我叫張三,你叫李四,那么「人 -> 人名」的算法就叫屬于一種哈希算法。哈希算法通常用于制作數字指紋,數字指紋的意思就是「你看到這個東西就像看到原數據一樣」,例如我們在一些網站下載大文件的時候,網站提供給我們驗證文件完整性的 MD5 或者 SHA1 碼,就是原文件的哈希值。哈希算法有很多種,MD5 是其中的一種,這就是 MD5。所以,優秀的哈希算法通常需要具有低碰撞概率(即不同數據的哈希值通常也不一樣)。
加密是什么?
加密,指的是對數據進行轉換以后,數據變成了另一種格式,并且除了拿到解密方法的人,沒人能把數據轉換回來。因此,加密通常用于網絡通信。因為網絡上的通信數據,任何人都有可能會拿到,把數據加密后再傳送,送達以后由對方解密后再查看,就可以防止網絡上的偷窺。例如大家都知道「安全」但很少人知道「為什么安全」的 HTTPS,就是通過加密算法來保障的網絡安全性。
所以,MD5 是加密嗎?
加密算法的目的,在于別人無法成功查看加密后的數據,并且在需要的時候還可以對數據進行解密來重新查看數據。而 MD5 算法是一種哈希算法,哈希算法的設計目標本身就決定了,它在大多數時候都是不可逆的,即你經過哈希算法得出的數據,無法再經過任何算法還原回去。所以,既然不能將數據還原,也就不能稱之為可以解密;既然不能解密,那么哈希的過程自然也就不能稱作是「加密」了。
「不可逆加密」?
你如果試試去查詢百度百科,會發現有一個「MD5 加密」的詞條:
甚至還有一個詞條叫做「不可逆加密算法」:
在「不可逆加密算法」詞條下,MD5 赫然在列。
然而,他們都是錯的。甚至,「不可逆加密算法」這個詞,也是人造的。你甚至可以在網上搜索到一些博客,將加密算法歸類為「可逆加密」和「不可逆加密」兩類。這其實不能怪百度百科,也不能怪這些歸類的人,要怪只能怪,關于數據轉換相關的內容太多、太雜,導致大家用著用著就混淆了。
這些小知識有什么用?
在開發中,經常會遇到 RSA、AES、BASE64、MD5、SHA1、SHA256、GZIP 這些詞,他們的意義和使用場景都是各不相同的。在剛入行的時候,作為一個底層小碼農,只要按照同事的指示,讓我 BASE64 我就 BASE64,讓我 MD5 我就 MD5,不用問為什么。但是當你有了一定工作經驗之后,就應該慢慢開始對這些內容有所了解了,不然不僅在開發中會遇到各種障礙,而且在項目出了相關問題的時候,你甚至不知道是你的問題還是同事的問題。做開發,誰都想往高處走,但你在往高處走之前,需要先建立起自己的優勢。
所以如果你只是把這當做一個「小知識」,用「MD5 是不是加密」來跟朋友炫技或者用來在面試時提問求職者,這可能確實沒有什么用。要知道,有用的不是小知識,而是在你能夠對這些小知識輕松回答時,所體現出的完整知識體系。如果把它的本質了解清楚,它到底是什么、有什么用、怎么用,以及它的相關知識都有哪些,它們各自的含義、用法和區別是什么,這樣的體系化的知識,以及這種不斷把自己的知識向體系化轉換的意識,將會對你非常有用。