徹底理解 C 語(yǔ)言中的指針
大家好,我是小風(fēng)哥。
假定給你一塊非常小的內(nèi)存,這塊內(nèi)存只有8字節(jié),這里也沒(méi)有高級(jí)語(yǔ)言,沒(méi)有操作系統(tǒng),你操作的數(shù)據(jù)單位是單個(gè)字節(jié),你該怎樣讀寫(xiě)這塊內(nèi)存呢?
注意這里的限定,再讀一遍,沒(méi)有高級(jí)語(yǔ)言,沒(méi)有操作系統(tǒng),在這樣的限制之下,你必須直面內(nèi)存讀寫(xiě)的本質(zhì)。
這個(gè)本質(zhì)是什么呢?
本質(zhì)是你需要意識(shí)到內(nèi)存就是一個(gè)一個(gè)裝有字節(jié)的小盒子,這些小盒子從0到N編好了序號(hào)。
這時(shí)如果你想計(jì)算1+2,那么你必須先把1和2分別放到兩個(gè)小盒子中,假設(shè)我們使用Store指令,把數(shù)字1放到第6號(hào)小盒子,那么用指令表示就是這樣:
- store 1 6
注意看這條指令,這里出現(xiàn)了兩個(gè)數(shù)字:1和6,雖然都是數(shù)字,但這兩個(gè)數(shù)字的含義是不同的,一個(gè)代表數(shù)值,一個(gè)代表內(nèi)存地址。
與寫(xiě)對(duì)應(yīng)的是讀,假設(shè)我們使用load指令,就像這樣:
- load r1 6
現(xiàn)在依然有一個(gè)問(wèn)題,這條指令到底是數(shù)字6寫(xiě)入r1寄存器還是把第6號(hào)小盒子中裝的數(shù)字寫(xiě)入r1寄存器?
可以看到,數(shù)字在這里是有歧義的,它既可以表示數(shù)值也可以表示地址,為加以區(qū)分我們需要給數(shù)字添加一個(gè)標(biāo)識(shí),比如對(duì)于前面加上$符號(hào)的就表示數(shù)值,否則就是地址:
- store $1 6
- load r1 6
這樣就不會(huì)有歧義了。
現(xiàn)在第6號(hào)內(nèi)存中裝入了數(shù)值1:
即地址6代表數(shù)字1:
- 地址6 -> 數(shù)字1
但“地址6”對(duì)人類(lèi)來(lái)說(shuō)太不友好了,人類(lèi)更喜歡代號(hào),也就是起名字,假設(shè)我們給“地址6”換一個(gè)名字,叫做a,a代表的就是地址6,a中存儲(chǔ)的值就是1,用人類(lèi)在代數(shù)中直觀的表示就是:
- a = 1
就這樣所謂的變量一詞誕生了。
我們可以看到,從表面上看變量a等價(jià)于數(shù)值1,但背后還隱藏著一個(gè)重要的信息,那就是變量a代表的數(shù)字1存儲(chǔ)在第6號(hào)內(nèi)存地址上,即變量a或者說(shuō)符號(hào)a背后的含義是:
- 表示數(shù)值1
- 該數(shù)值存儲(chǔ)在第6號(hào)內(nèi)存地址
到現(xiàn)在為止第2個(gè)信息好像不太重要,先不用管它。
既然有變量a,就會(huì)有變量b,如果有這樣一個(gè)表示:
- b = a
把a(bǔ)的值給到b,這個(gè)賦值在內(nèi)存中該怎么表示呢?
很簡(jiǎn)單,我們?yōu)樽兞縝也找一個(gè)小盒子,假設(shè)變量b放在第2號(hào)小盒子上:
可以看到,我們完全copy了一份變量a的數(shù)據(jù)。
現(xiàn)在有了變量,接下來(lái)讓我們升級(jí)一下,假設(shè)變量a不僅僅可以表示占用1個(gè)字節(jié)的數(shù)據(jù),也可以表示占用任意多內(nèi)存的數(shù)據(jù),就像這樣:
現(xiàn)在變量a占據(jù)5個(gè)字節(jié),足足占用了整個(gè)內(nèi)存的一大半空間,此時(shí)如果我們依然想要表示b = a會(huì)怎樣呢?
如果你依然采用copy 的方法會(huì)發(fā)現(xiàn)我們的內(nèi)存空間已經(jīng)不夠用了,因?yàn)檎麄€(gè)內(nèi)存大小就8字節(jié),采用copy的方法僅這兩個(gè)變量代表的數(shù)據(jù)就將占據(jù)10字節(jié)。
怎么辦呢?
不要忘了變量a背后可是有兩個(gè)含義的,再讓我們看一下:
- 表示數(shù)值1
- 該數(shù)值存儲(chǔ)在第6號(hào)內(nèi)存地址
重點(diǎn)看一下第2個(gè)含義,這個(gè)含義告訴我們什么呢?
它告訴我們不管一個(gè)變量占據(jù)多少內(nèi)存空間,我們總可以通過(guò)它在內(nèi)存中地址找到該數(shù)據(jù),而內(nèi)存地址僅僅就是一個(gè)數(shù)字,這個(gè)數(shù)字和該數(shù)據(jù)占用空間的大小無(wú)關(guān)。
啊哈,現(xiàn)在變量的第2個(gè)含義終于排上用場(chǎng)了,如果我們想用變量b也去指代變量a,干嘛非要直接copy一份數(shù)據(jù)呢?直接使用地址就不好了,就像這樣:
變量a在內(nèi)存中地址為3,因此變量b中我們可以?xún)H僅存儲(chǔ)3這個(gè)數(shù)字即可。
現(xiàn)在變量b就開(kāi)始變得非常有趣了。
首先變量b沒(méi)什么特殊的,只不過(guò)變量b存儲(chǔ)的東西我們不可以按照數(shù)值來(lái)解釋?zhuān)潜仨毎凑盏刂穪?lái)解釋。
當(dāng)一個(gè)變量不僅僅可以用來(lái)保存數(shù)值也可以保存內(nèi)存地址時(shí),指針誕生了。
有很多資料僅僅說(shuō)指針就是地址,但小風(fēng)哥認(rèn)為這是一種偷懶的解釋?zhuān)瑑H僅停留在匯編層面來(lái)理解,有失偏頗,在高級(jí)語(yǔ)言中,指針首先是一個(gè)變量,只不過(guò)這個(gè)變量保存的恰好是地址而已,指針是內(nèi)存地址的更高一級(jí)抽象。
如果僅僅把指針理解為內(nèi)存地址的話你就必須知道所謂的間接尋址。
這是什么意思呢?
如果使用匯編語(yǔ)言來(lái)加載變量a的值該怎么寫(xiě)呢?
- load r1 1
想一想,這是不是會(huì)有問(wèn)題,因此這樣的話該指令會(huì)把數(shù)值3加載到r1寄存器中,然而我們想要把內(nèi)存地址1中保存的數(shù)值也解釋為內(nèi)存地址,這時(shí)必須為1再次添加一個(gè)標(biāo)識(shí),比如@:
- load r1 @1
這時(shí)該指令會(huì)首先把內(nèi)存地址1中保存的值讀取出來(lái)發(fā)現(xiàn)是3,然后再次把3按照內(nèi)存地址進(jìn)行解釋?zhuān)?指向的數(shù)據(jù)就是變了a:
- 地址1 -> 地址3 -> 數(shù)據(jù)a
這就是所謂的間接尋址,Indirect addressing,在匯編語(yǔ)言下你必須能意識(shí)到這一層間接尋址,因?yàn)樵趨R編語(yǔ)言中是沒(méi)有變量這個(gè)概念的。
然而高級(jí)語(yǔ)言則不同,這里有變量的概念,此時(shí)地址1代表變量b,但使用變量的一個(gè)好處就在于很多情況下我們只需要關(guān)心其第一個(gè)含義,也就是說(shuō)我們只需要關(guān)心變量b中保存了地址3,而不需要關(guān)心變量b到底存儲(chǔ)在哪里,這樣使用變量b時(shí)我們就不需在大腦里想一圈間接尋址這一問(wèn)題了,在程序員的大腦里變量b直接指向數(shù)據(jù)a:
- b -> 數(shù)據(jù)a
再來(lái)對(duì)比一下:
- 地址1 -> 地址3 -> 數(shù)據(jù)a # 匯編語(yǔ)言層面
- 變量b -> 數(shù)據(jù)a # 高級(jí)語(yǔ)言層面
這就是為什么我說(shuō)指針其實(shí)是內(nèi)存地址的更高級(jí)抽象,這個(gè)抽象的目的就在于屏蔽間接尋址。
當(dāng)變量不僅僅可以存值也可以存放地址時(shí),一個(gè)全新的時(shí)代到來(lái)了:看似松散的內(nèi)存在內(nèi)部竟然可以通過(guò)指針組織起來(lái),同時(shí)這也讓程序直接處理復(fù)雜的數(shù)據(jù)結(jié)構(gòu)成為可能,比如就像下圖這樣:
這就是所謂的鏈表了。
指針這個(gè)概念首次出現(xiàn)在 PL/I 語(yǔ)言中,當(dāng)時(shí)是為了增加鏈表處理能力,大家不要以為鏈表這種數(shù)據(jù)結(jié)構(gòu)是非常司空見(jiàn)慣的,這在1964年左右并不是一件容易的事情,關(guān)于鏈表你還可以參考這篇《徹底理解鏈表》。
值得一提的是,Multics操作系統(tǒng)就是 PL/I 語(yǔ)言實(shí)現(xiàn)的,這也是第一個(gè)用高級(jí)語(yǔ)言實(shí)現(xiàn)的操作系統(tǒng),然而Multics操作系統(tǒng)在商業(yè)上并不成功,參與該項(xiàng)目的Ken Thompson, Dennis Ritchie后來(lái)決定自己寫(xiě)一個(gè)更簡(jiǎn)單的,Unix以及C語(yǔ)言誕生了,或許是在開(kāi)發(fā)Multic時(shí)見(jiàn)識(shí)到了PL/I語(yǔ)言中指針的威力,C語(yǔ)言中也有指針的概念。
那么指針在C語(yǔ)言中是一個(gè)什么樣的概念?為什么說(shuō)指針威力強(qiáng)大但又破壞性十足?引用和指針又有什么關(guān)聯(lián)?
本文轉(zhuǎn)載自微信公眾號(hào)「碼農(nóng)的荒島求生」,可以通過(guò)以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系碼農(nóng)的荒島求生公眾號(hào)。