C語言之指針綜合談
發(fā)表時間:2024-05-18 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]概述 Joel Spolsky認(rèn)為,對指針的理解是一種aptitude,不是通過訓(xùn)練就可以達(dá)到的。雖然如此,我還是想談一談這個C/C++語言中最強(qiáng)勁也是最容易出錯的要素! ¤b于指針和目前計算機(jī)內(nèi)存結(jié)構(gòu)的關(guān)聯(lián),很多C語言比較本質(zhì)的特點都孕育在其中,因此,本篇和第六、第七兩篇我都將以指針為主線,結(jié)...
概述
Joel Spolsky認(rèn)為,對指針的理解是一種aptitude,不是通過訓(xùn)練就可以達(dá)到的。雖然如此,我還是想談一談這個C/C++語言中最強(qiáng)勁也是最容易出錯的要素。
鑒于指針和目前計算機(jī)內(nèi)存結(jié)構(gòu)的關(guān)聯(lián),很多C語言比較本質(zhì)的特點都孕育在其中,因此,本篇和第六、第七兩篇我都將以指針為主線,結(jié)合在實際編程中遇到的問題,來詳細(xì)談?wù)勱P(guān)于指針的幾個重要方面。
指針類型的本質(zhì)分析
1、指針的本質(zhì)
指針的本質(zhì):一種復(fù)合的數(shù)據(jù)類型。下面我將以下面幾個作為例子進(jìn)行展開分析:
a)、int *p;
b)、int **p;
c)、int (*parValue)[3];
d)、int (*pFun)();
分析:
所謂的數(shù)據(jù)類型就是具有某種數(shù)據(jù)特征的東東,比如數(shù)據(jù)類型char,它的數(shù)據(jù)特征就是它所占據(jù)的內(nèi)存為1個字節(jié), 指針也很類似,指針?biāo)赶虻闹狄舱紦?jù)著內(nèi)存中的一塊地址,地址的長度與指針的類型有關(guān),比如對于char型指針,這個指針占據(jù)的內(nèi)存就是1個字節(jié),因此指針也是一種數(shù)據(jù)類型,但我們知道指針本身也占據(jù)了一個內(nèi)存空間地址,地址的長度和機(jī)器的字長有關(guān),比如在32位機(jī)器中,這個長度就是4個字節(jié),因此指針本身也同樣是一種數(shù)據(jù)類型,因此,我們說,指針其實是一種復(fù)合的數(shù)據(jù)類型,
好了,現(xiàn)在我們可以分析上面的幾個例子了。
假設(shè)有如下定義:
那么,nValue的類型就是int,也就是把nValue這個具體變量去掉后剩余的部分,因此,上面的4個聲明可以類比進(jìn)行分析:
a)、int *
*代表變量(指針本身)的值是一個地址,int代表這個地址里面存放的是一個整數(shù),這兩個結(jié)合起來,int *定義了一個指向整數(shù)的指針,類推如下:
b)、int **
指向一個指向整數(shù)的指針的指針。
c)、int (*)[3]
指向一個擁有三個整數(shù)的數(shù)組的指針。
d)、int (*)()
指向一個函數(shù)的指針,這個函數(shù)參數(shù)為空,返回值為整數(shù)。
分析結(jié)束,從上面可以看出,指針包括兩個方面,一個是它本身的值,是一個內(nèi)存中的地址;另一個是指針?biāo)赶虻奈,是這個地址中所存放著具有各種各樣意義的數(shù)據(jù)。
2、對指針本身值的分析
下面例子考察指針本身的值(環(huán)境為32位的計算機(jī)):
請計算sizeof ( p ) = ?
char str[] = “Hello” ; char *p = str ; |
請計算sizeof ( p ) = ?
void Func ( char str[100]) { 請計算 sizeof( str ) = ? //注意,此時,str已經(jīng)退化為一個指針,詳情見 //下一篇指針與數(shù)組 } |
分析:上面的例子,答案都是4,因為從上面的討論可以知道,指針本身的值對應(yīng)著內(nèi)存中的一個地址,它的size只與機(jī)器的字長有關(guān)(即它是由系統(tǒng)的內(nèi)存模型決定的),在32位機(jī)器中,這個長度是4個字節(jié)。
3、對指針?biāo)赶蛭锏姆治?br>
現(xiàn)在再對指針這個復(fù)合類型的第二部分,指針?biāo)赶蛭锏囊饬x進(jìn)行分析。
上面我們已經(jīng)得到了指針本身的類型,那么將指針本身的類型去掉 “*”號就可得到指針?biāo)赶蛭锏念愋,分別如下:
a)、int
所指向物是一個整數(shù)。
b)、int*
所指向物是一個指向整數(shù)的指針。
c)、int ()[3]
()為空,可以去掉,變?yōu)閕nt [3],所指向物是一個擁有三個整數(shù)的數(shù)組。
d)、int ()()
第一個()為空,可以去掉,變?yōu)閕nt (),所指向物是一個函數(shù),這個函數(shù)的參數(shù)為空,返回值為整數(shù)。
4、附加分析
另外,關(guān)于指針本身大小的問題,在C++中與C有所不同,這里我也順帶談一下。
在C++中,對于指向?qū)ο蟪蓡T的指針,它的大小不一定是4個字節(jié),這主要是因為在引入多重虛擬繼承以及虛擬函數(shù)的時候,有些附加的信息也需要通過這個指針進(jìn)行傳遞,因此指向?qū)ο蟪蓡T的指針會增大,不論是指向成員數(shù)據(jù),還是成員函數(shù)都是如此,具體與編譯器的實現(xiàn)有關(guān),你可以編寫個很小的C++程序去驗證一下。另外,對一個類的靜態(tài)成員(static member,可以是靜態(tài)成員變量或者靜態(tài)成員函數(shù))來說,指向它的指針只是普通的函數(shù)指針,而不是一個指向類成員的指針,所以它的大小不會增加,仍舊是4個字節(jié)。
指針運算符&和*
“&和*”,它們是一對相反的操作,’&’取得一個物的地址(也就是指針本身),’*’得到一個地址里放的物(指針?biāo)赶虻奈铮。這個東西可以是值(對象)、函數(shù)、數(shù)組、類成員(class member)等等。
參照上面的分析我們可以很好地理解&與*。
使用指針的好處?
關(guān)于指針的本質(zhì)和基本的運算符我們討論過了,在這里,我想再籠總地談一談使用指針的必要性和好處,為我們今后的使用和對后面篇章的理解做好鋪墊。簡而言之,指針有以下好處:
1)、方便使用動態(tài)分配的數(shù)組。
這個解釋我放在本系列第六篇中進(jìn)行講解。
2)、對于相同類型(甚至是相似類型)的多個變量進(jìn)行通用訪問。
就是用一個指針變量不斷在多個變量之間指來指去,從而使得非常應(yīng)用起來非常靈活,不過,這招也比較危險,需要小心使用:因為出現(xiàn)錯誤的指針是編程中非常忌諱的事情。
3)、變相改變一個函數(shù)的值傳遞特性。
說白了,就是指針的傳地址作用,將一個變量的地址作為參數(shù)傳給函數(shù),這樣函數(shù)就可以修改那個變量了。
4)、節(jié)省函數(shù)調(diào)用代價。
我們可以將參數(shù),尤其是大個的參數(shù)(例如結(jié)構(gòu),對象等),將他們地址作為參數(shù)傳給函數(shù),這樣可以省去編譯器為它們制作副本所帶來的空間和時間上的開銷。
5)、動態(tài)擴(kuò)展數(shù)據(jù)結(jié)構(gòu)。
因為指針可以動態(tài)地使用malloc/new生成堆上的內(nèi)存,所以在需要動態(tài)擴(kuò)展數(shù)據(jù)結(jié)構(gòu)的時候,非常有用;比如對于樹、鏈表、Hash表等,這幾乎是必不可少的特性。
6)、與目前計算機(jī)的內(nèi)存模型相對應(yīng),可按照內(nèi)存地址進(jìn)行直接存取,這使得C非常適合于一些較底層的應(yīng)用。
這也是C/C++指針一個強(qiáng)大的優(yōu)點,我會在后面講述C語言的底層操作時,較詳細(xì)地介紹這個優(yōu)點的應(yīng)用。
7)、遍歷數(shù)組。
據(jù)個例子來說吧,當(dāng)你需要對字符串?dāng)?shù)組進(jìn)行操作時,想一想,你當(dāng)然要用字符串指針在字符串上掃來掃去。
…實在太多了,你可以慢慢來補(bǔ)充^_^。
指針本身的相關(guān)問題
1、問題:空指針的定義
曾經(jīng)看過有的.h文件將NULL定義為0L,為什么?
答案與分析:
這是一個關(guān)于空指針宏定義的問題。指針在C語言中是經(jīng)常使用的,有時需要將一個指針置為空指針,例如在指針變量初始化的時候。
C語言中的空指針和Pascal或者Lisp語言中的NIL具有相同的地位。那如何定義空指針呢?下面的語句是正確的:
char *p1 = 0; int *p2; if (p != 0) { ... } p2 = 0; |
也就是說,在指針變量的初始化、賦值、比較操作中,0會被編譯器理解為要將指針置為空指針。至于空指針的內(nèi)部表示是否是0,則隨不同的機(jī)器類型而定,不過通常都是0。但是在另外一些場合下,例如函數(shù)的參數(shù)原型是指針類型,函數(shù)調(diào)用時如果將0作為參數(shù)傳入,編譯器則不能將其理解為空指針。此時需要明確的類型轉(zhuǎn)換,例如:
void func (char *p); func ((char *)0); |
一般情況下,0是可以放在代碼中和指針關(guān)聯(lián)使用的,但是有些程序員(數(shù)量還不少呦!也許就包括你在內(nèi))不喜歡0的直白,認(rèn)為其不能表示作為指針的特殊含義,于是要定義一個宏NULL,來明確表示空指針常量。這也是對的,人家C語言標(biāo)準(zhǔn)就明確說:“ NULL應(yīng)該被定義為與實現(xiàn)相關(guān)的空指針常量”。但是將NULL定義成什么樣的值呢?我想你一定見過好幾種定義NULL的方法:
#define NULL 0 #define NULL (char *)0 #define NULL (void *)0 |
在我們使用的絕大多數(shù)計算系統(tǒng)上,例如PC,上述定義是能夠工作的。然而,世界上還有很多其它種類的計算機(jī),其CPU也不是Intel的。在某些系統(tǒng)上,指針和整數(shù)的大小和內(nèi)部表示并不一致,甚至不同類型的指針的大小都不一致。為了避免這種可移植性問題,0L是一種最為安全的、最妥帖的定義方式。0L的含義是: “值為0的整數(shù)常量表達(dá)式”。這與C語言給出的空指針定義完全一致。因此,建議采用0L作為空指針常量NULL的值。
其實 NULL定義值,和操作系統(tǒng)的的平臺有關(guān), 將一個指針定義為 NULL, 其用意是為了保護(hù)操作系統(tǒng),因為通過指針可以訪問任何一塊地址, 但是,有些數(shù)據(jù)是不許一般用戶訪問的,比如操作系統(tǒng)的核心數(shù)據(jù)。 當(dāng)我們通過一個空(NULL)的指針去方位數(shù)據(jù)時,系統(tǒng)會提示非法, 那么系統(tǒng)又是如何知道的呢??
以windows2000系統(tǒng)為例, 該系統(tǒng)規(guī)定系統(tǒng)中每個進(jìn)程的起始地址(0x00000000)開始的某個地址范圍內(nèi)是存放系統(tǒng)數(shù)據(jù)的,用戶進(jìn)程無法訪問, 所以當(dāng)用戶用空指針(0)訪問時,其實訪問的就是0x00000000地址的系統(tǒng)數(shù)據(jù),由于該地址數(shù)據(jù)是受系統(tǒng)保護(hù)的,所以系統(tǒng)會提示錯誤(指針訪問非法)。
這也就是說NULL值不一定要定義成0,起始只要定義在系統(tǒng)的保護(hù)范圍的地址空間內(nèi),比如定義成(0x00000001, 0x00000002)都會起到相同的作用,但是為了考慮到移植性,普遍定義為0 。
2、問題:與指針相關(guān)的編程規(guī)則&規(guī)則分析
指針既然這么重要,而且容易出錯,那么有沒有方法可以很好地減少這些指針相關(guān)問題的出現(xiàn)呢?
答案與分析:
減少出錯的根本是徹底理解指針。
在方法上,遵循一定的編碼規(guī)則可能是最立竿見影的方法了,下面我來闡述一下與指針相關(guān)的編程規(guī)則:
1) 未使用的指針初始化為NULL 。
2) 在給指針分配空間前、分配后均應(yīng)作判斷。
3) 指針?biāo)赶虻膬?nèi)容刪除后也要清除指針本身。
要牢記指針是一個復(fù)合的數(shù)據(jù)結(jié)構(gòu)這個本質(zhì),所以我們不論初始化和清除都要同時兼顧指針本身(上述規(guī)則1,3)和指針?biāo)赶虻膬?nèi)容(上述規(guī)則2,3)這兩個方面。
遵循這些規(guī)則可以有效地減少指針出錯,我們來看下面的例子:
void Test(void) { char *str = (char *) malloc(100); strcpy(str, “hello”); free(str); if(str != NULL) { strcpy(str, “world”); printf(str); } } |
請問運行Test函數(shù)會有什么樣的結(jié)果?
答:
篡改動態(tài)內(nèi)存區(qū)的內(nèi)容,后果難以預(yù)料,非常危險。因為free(str);之后,str成為野指針,if(str != NULL)語句不起作用。
如果我們牢記規(guī)則3,在free(str)后增加語句:
那么,就可以防止這樣的錯誤發(fā)生。