C指針深度解析

（1）指針的概念

指針是一種數據類型，而內存地址是這種數據類型具體的值（注意區分兩者的概念）。先說一下什么是內存地址：假設CPU的尋址方式是以字節尋址的，即每一個字節對應一個地址編號（則機器字長、存儲字長和數據字長都是字節的整數倍，所有的數據類型占據的空間大小都是字節的整數倍）。對于32位操作系統，地址碼最長可達32位，則可以尋址的最大數目為： $2^{32}$ =4G，由于最小單位是字節，因此可尋址的最大內存為4GB。64位操作系統，則為 $2^{64}$ B。因此，在32位操作系統中，地址（指針值）是一個32位的二進制數：0~ $2^{32}$ -1，因此指針變量（地址值）在32位操作系統中占據的空間大小為4bytes（32位），由于地址值用32位二進制數表示不方便，因此用8位16進制數表示（0x00000000~0xFFFFFFFF）。指針變量跟其余任何變量一樣，都是一個值，且都要占據地址空間。指針是指本身的地址值，與指針的地址不同（兩者不一定相等）。指針：計算機內一塊內存來存放另一塊內存的地址（注意是首地址）。所以，對一個指針取地址，無非就是對一塊內存取地址，跟對一個整數取地址，對一個浮點數取地址，對一個數組取地址，對一個函數取地址，沒有任何區別：char c[5]="abc"; // 內存c的地址是：&c??? void f(int size, float length); // 內存f的地址是：&f??? int *p = &a; // 內存p的地址是：&p? 一般情況下：字節占據1個字節，int為4個字節，指針跟操作系統位數相關。

int *p1； int **p2； int (*p3)[5];?? int (**p4)[5];?? int (*p5)[5][5];? p1~p5都是指針，p1為一級指針；p2為二重指針（二級指針或指針的指針），即p2所指的地址的內容依然是地址，而該地址所指的地址的內容為int類型；p3為指針，其類型為int (*)[5]，所指地址存儲的內容為整型數組（5個元素）；p4為二級指針，其最終存儲的內容為整型數組（5個元素）；p5為指針，其類型為int (*)[5][5]，所指地址存儲的內容為整型二維數組（25個元素）。

指針的步長。每個指針都是有步長的，這與指針的計算有著密切關系。指針的步長就是指針（地址）所指的內容的大小（占據的字節數）。如 int *p，則p的步長為4bytes，p+1則是p地址的基礎上移動4個bytes。int (*p3)[5]; p3的步長就是20bytes。

*與[ ]對指針的作用。*(p+i)是取出指針p+i所指向的內容，如*p1是取出的整形數值int；*p3是取出的整個一維數組（5個元素）。int a[6][7]； *a取出的是a[0]這個一維數組；*(a+1)取出的是a[1]這個一維數組；*a[0]取出的是a[0][0]。*(p+i)=p[i]，兩者作用一樣，即p[i]則是指將指針p移動i個步長后所指向的內容。

二級指針步長分析（二級指針的內存分布）。例如：int **p； p是一個地址，由于p地址的內容依然是地址，因此p指針的步長為指針的字節數（8個字節，以32位為例）。因此所有二級指針的步長都是一樣的，都是8bytes。而*p依然是指針，即存儲的內容為int數值，因此*p的步長為4bytes。因此，當用二級指針p來表示一個二維數組時，其每一個元素（int）在內存中的分布并不向二維數組int a[i][j]那樣都是連續的，它們的分布不一樣的。*p表示二維數組中的每一個元素a[i]（一維數組）的首地址，而p則是將所有*p作為一維數組的首地址。因此，在用指針p表示二維數組時，只有二維數組中的每一個元素（一位數組）內部分布是連續的，至于元素與元素之間的分布不一定是連續的，取決于*p與*(p+1)的值。綜上，二級指針p與二維數組a之間不能相互傳遞參數，因為它們在內存中的分布是不一樣的，否則會引發段錯誤（SIGSEGV）。如果p=a；則p的步長為8bytes，則*p或p[0]就會把數組a的前兩個元素a[0][0]和a[0][1]合并在一起8個字節當成一個地址，緊接著*(*p)或p[0][0]就是前一個地址所指向的前4個bytes的內容，但是*p這個地址是用戶未定義的，因此屬于非法訪問內存，因此會引發段錯誤。所以，一定要注意，兩者之間不能直接傳遞參數。可以將二維數組重新用二級指針表示（后面會介紹方法），然后就可以用二級指針p來訪問二維數組了，其訪問方法為：p[i][j]或*(*(p+i)+j)，即：先將指針p移動i個步長取出地址值，然后再移動j個步長的地址的內容就是p[i][j]元素，對應的就是a[i][j]。

對于一維數組int a[10]；與int *p；p與a之間可以直接傳遞，因為內存分布一樣，具體分析同前面。p=a，則*(p+i)=p[i]=a[i]。對于char *argv[10]； char **p; ?p與argv之間也可以直接傳遞數據，因為兩者內存分布一樣：*(p+i)=p[i]=argv[i]，都是char *類型的指針，它們存儲的內容都是char，步長都為1bytes，因此都可以表示一個字符串，所以在命令行參數和環境變量中可以使用char **p二級指針來傳遞形參。

二維數組int b[i][j]；用二級指針int **p；來表示：int *a[i]；a[i]=b[i]；p=a；則有：*(p+i)=p[i]=a[i]，*(*(p+i)+j)=p[i][j]=a[i][j]=b[i][j]。因此，b與p之間要傳遞參數時，可以用a來搭橋。

（2）指針與數組的關系舉例分析

探究數組名與指針的關系：將a[3][5]全部元素初始化為0

//ex1.c

#include <stdio.h>int main(void)
{int a[10]={0};int *p;p=a;printf("a[1]=%d, &p=%#x, p=%#x\n",p[1],&p,p);return 0;
}
[root@localhost 01_pthread_test]# ./ex1
a[1]=0, &p=0xff875cc4, p=0xff875cc8

//ex.c

#include <stdio.h>int main(void)
{int **p;int a[3][5]={0};p=a;printf("&a=%#x, a=%#x, a[0]=%#x, *a=%#x, a+1=%#x, a[0]+1=%#x, a[1]=%#x, &a[0][0]=%#x\n",&a, a,a[0],*a,a+1,a[0]+1,a[1],&a[0][0]);printf("*(&a[0][0])=%#x\n",*(&a[0][0]));printf("*(*a)=%#x\n",*(*a));printf("a=%#x\n",a);printf("&p=%#x, p=%#x, *p=%#x\n",&p,p,*p); printf("*(*p)=%d\n",*(*p));   //該句出現段錯誤return 0;
}
[root@localhost 01_pthread_test]# ./ex
&a=0xff83a4d0, a=0xff83a4d0, a[0]=0xff83a4d0, *a=0xff83a4d0, a+1=0xff83a4e4, a[0]+1=0xff83a4d4, a[1]=0xff83a4e4, &a[0][0]=0xff83a4d0
*(&a[0][0])=0
*(*a)=0
a=0xff83a4d0
&p=0xff83a50c, p=0xff83a4d0, *p=0
Segmentation fault (core dumped)

//ex2.c（二維數組用二級指針的另一種表示方法）

#include <stdio.h>
#include <stdlib.h>
#include <stddef.h>int main(void)
{int **p;int i, j;p=(int **)malloc( sizeof(int *)*3 );for(i=0;i<3;i++){p[i]=(int *)malloc( sizeof(int)*5 );}for(i=0;i<3;i++)for(j=0;j<5;j++){p[i][j]=3;}printf("p[2][3]=%d\n",p[2][3]);return 0;
}
[root@localhost 01_pthread_test]# ./ex2
p[2][3]=3

分析：

強調一點：數組名、函數名等類似的東西都不是指針！！！只是在使用的時候它們被隱式轉換為了指針。一維數組：int a[10]; sizeof(a)中，a就沒有轉換為指針，a指的就是數組本身，sizeof(a)的結果為40（40bytes）。如果對a的操作中涉及元素的操作時，由于僅僅指出a系統并不清楚要具體取哪一個元素，因此直接返回給數組的首地址，即a被隱式轉換為數組的第一個元素的地址&a[0]。二維數組：int a[10][9]；其本質就是一個一維數組（數組的數組），在內存中的分布是一維的，一行緊接著一行連續分布：即a[0][8]的后面緊接著就是a[1][0]。a[10][9]可以看成是a[0]、a[1]、······、a[9]這十個元素構成的數組，其中a[0]是二維數組的首元素；而a[0]、a[1]、······、a[9]這十個元素中每一個元素又是一個數組（類型為int [9]），即a[0]代表：a[0][0]~a[0][8]。因此在隱式轉換時：a被隱式轉換為二維數組第一個元素的首地址，即a=&a[0]，a的步長為36bytes，指向的是a[0]這個數組（這一行）；而a[0]如果進行隱式轉換，則轉換為a[0]這個一維數組的首地址，即&a[0][0]。注意，a與a[0]隱式轉換后值是相等的，但是步長不一樣，a[0]轉換后，所指向的內容是a[0][0]，即int類型，因此步長為4bytes。因此a與a[0]的指針值雖然是相等的，但是步長不一樣，即：a+1與a[0]+1不相等。a+1指向的是a[1][0]，a[0]+1指向的是a[0][1]。

在上面程序ex.c中。p、&a、a、a[0]、*a、a+1、a[0]+1、a[1]、&a[0][0]、*(&a[0][0])、*(*a)。p是一個二級指針，最終地址內容為int型數值；&a為int (*)[3][5]類型，即指向整個二維數組；a是整個數組，隱式轉換為指向a[0]的指針，int (*)[5]類型；a[0]是一維數組，隱式轉換為指向a[0][0]的指針，int *類型；*a經歷了兩次隱式轉換，第一次a被轉換，第二次*a被轉換，最終為指向a[0][0]的指針，為int *類型；a+1，int (*)[5]類型；a[0]+1，int *類型；a[1]，int *類型；&a[0][0]，int *類型。根據上面程序輸出結果可以判斷。若p=a，則&p，int ***類型；p，int **類型；*p為int*內容；此時程序可以輸出結果（不會發生錯誤），但是結果毫無意義。*(*p)則會發生段錯誤，因此*p地址的內容用戶未定義，非法訪問內存。

程序ex2.c描述了另一種方法將二級指針表示二維數組。