(1)指針的概念
指針是一種數據類型,而內存地址是這種數據類型具體的值(注意區分兩者的概念)。先說一下什么是內存地址:假設CPU的尋址方式是以字節尋址的,即每一個字節對應一個地址編號(則機器字長、存儲字長和數據字長都是字節的整數倍,所有的數據類型占據的空間大小都是字節的整數倍)。對于32位操作系統,地址碼最長可達32位,則可以尋址的最大數目為:=4G,由于最小單位是字節,因此可尋址的最大內存為4GB。64位操作系統,則為
B。因此,在32位操作系統中,地址(指針值)是一個32位的二進制數:0~
-1,因此指針變量(地址值)在32位操作系統中占據的空間大小為4bytes(32位),由于地址值用32位二進制數表示不方便,因此用8位16進制數表示(0x00000000~0xFFFFFFFF)。指針變量跟其余任何變量一樣,都是一個值,且都要占據地址空間。指針是指本身的地址值,與指針的地址不同(兩者不一定相等)。指針:計算機內一塊內存來存放另一塊內存的地址(注意是首地址)。所以,對一個指針取地址,無非就是對一塊內存取地址,跟對一個整數取地址,對一個浮點數取地址,對一個數組取地址,對一個函數取地址,沒有任何區別:char c[5]="abc"; // 內存c的地址是:&c??? void f(int size, float length); // 內存f的地址是:&f??? int *p = &a; // 內存p的地址是:&p? 一般情況下:字節占據1個字節,int為4個字節,指針跟操作系統位數相關。
int *p1; int **p2; int (*p3)[5];?? int (**p4)[5];?? int (*p5)[5][5];? p1~p5都是指針,p1為一級指針;p2為二重指針(二級指針或指針的指針),即p2所指的地址的內容依然是地址,而該地址所指的地址的內容為int類型;p3為指針,其類型為int (*)[5],所指地址存儲的內容為整型數組(5個元素);p4為二級指針,其最終存儲的內容為整型數組(5個元素);p5為指針,其類型為int (*)[5][5],所指地址存儲的內容為整型二維數組(25個元素)。
指針的步長。每個指針都是有步長的,這與指針的計算有著密切關系。指針的步長就是指針(地址)所指的內容的大小(占據的字節數)。如 int *p,則p的步長為4bytes,p+1則是p地址的基礎上移動4個bytes。int (*p3)[5]; p3的步長就是20bytes。
*與[ ]對指針的作用。*(p+i)是取出指針p+i所指向的內容,如*p1是取出的整形數值int;*p3是取出的整個一維數組(5個元素)。int a[6][7]; *a取出的是a[0]這個一維數組;*(a+1)取出的是a[1]這個一維數組;*a[0]取出的是a[0][0]。*(p+i)=p[i],兩者作用一樣,即p[i]則是指將指針p移動i個步長后所指向的內容。
二級指針步長分析(二級指針的內存分布)。例如:int **p; p是一個地址,由于p地址的內容依然是地址,因此p指針的步長為指針的字節數(8個字節,以32位為例)。因此所有二級指針的步長都是一樣的,都是8bytes。而*p依然是指針,即存儲的內容為int數值,因此*p的步長為4bytes。因此,當用二級指針p來表示一個二維數組時,其每一個元素(int)在內存中的分布并不向二維數組int a[i][j]那樣都是連續的,它們的分布不一樣的。*p表示二維數組中的每一個元素a[i](一維數組)的首地址,而p則是將所有*p作為一維數組的首地址。因此,在用指針p表示二維數組時,只有二維數組中的每一個元素(一位數組)內部分布是連續的,至于元素與元素之間的分布不一定是連續的,取決于*p與*(p+1)的值。綜上,二級指針p與二維數組a之間不能相互傳遞參數,因為它們在內存中的分布是不一樣的,否則會引發段錯誤(SIGSEGV)。如果p=a;則p的步長為8bytes,則*p或p[0]就會把數組a的前兩個元素a[0][0]和a[0][1]合并在一起8個字節當成一個地址,緊接著*(*p)或p[0][0]就是前一個地址所指向的前4個bytes的內容,但是*p這個地址是用戶未定義的,因此屬于非法訪問內存,因此會引發段錯誤。所以,一定要注意,兩者之間不能直接傳遞參數。可以將二維數組重新用二級指針表示(后面會介紹方法),然后就可以用二級指針p來訪問二維數組了,其訪問方法為:p[i][j]或*(*(p+i)+j),即:先將指針p移動i個步長取出地址值,然后再移動j個步長的地址的內容就是p[i][j]元素,對應的就是a[i][j]。
對于一維數組int a[10];與int *p;p與a之間可以直接傳遞,因為內存分布一樣,具體分析同前面。p=a,則*(p+i)=p[i]=a[i]。對于char *argv[10]; char **p; ?p與argv之間也可以直接傳遞數據,因為兩者內存分布一樣:*(p+i)=p[i]=argv[i],都是char *類型的指針,它們存儲的內容都是char,步長都為1bytes,因此都可以表示一個字符串,所以在命令行參數和環境變量中可以使用char **p二級指針來傳遞形參。
二維數組int b[i][j];用二級指針int **p;來表示:int *a[i];a[i]=b[i];p=a;則有:*(p+i)=p[i]=a[i],*(*(p+i)+j)=p[i][j]=a[i][j]=b[i][j]。因此,b與p之間要傳遞參數時,可以用a來搭橋。
(2)指針與數組的關系舉例分析
探究數組名與指針的關系:將a[3][5]全部元素初始化為0
//ex1.c
#include <stdio.h>int main(void)
{int a[10]={0};int *p;p=a;printf("a[1]=%d, &p=%#x, p=%#x\n",p[1],&p,p);return 0;
}
[root@localhost 01_pthread_test]# ./ex1
a[1]=0, &p=0xff875cc4, p=0xff875cc8
//ex.c
#include <stdio.h>int main(void)
{int **p;int a[3][5]={0};p=a;printf("&a=%#x, a=%#x, a[0]=%#x, *a=%#x, a+1=%#x, a[0]+1=%#x, a[1]=%#x, &a[0][0]=%#x\n",&a, a,a[0],*a,a+1,a[0]+1,a[1],&a[0][0]);printf("*(&a[0][0])=%#x\n",*(&a[0][0]));printf("*(*a)=%#x\n",*(*a));printf("a=%#x\n",a);printf("&p=%#x, p=%#x, *p=%#x\n",&p,p,*p); printf("*(*p)=%d\n",*(*p)); //該句出現段錯誤return 0;
}
[root@localhost 01_pthread_test]# ./ex
&a=0xff83a4d0, a=0xff83a4d0, a[0]=0xff83a4d0, *a=0xff83a4d0, a+1=0xff83a4e4, a[0]+1=0xff83a4d4, a[1]=0xff83a4e4, &a[0][0]=0xff83a4d0
*(&a[0][0])=0
*(*a)=0
a=0xff83a4d0
&p=0xff83a50c, p=0xff83a4d0, *p=0
Segmentation fault (core dumped)
//ex2.c(二維數組用二級指針的另一種表示方法)
#include <stdio.h>
#include <stdlib.h>
#include <stddef.h>int main(void)
{int **p;int i, j;p=(int **)malloc( sizeof(int *)*3 );for(i=0;i<3;i++){p[i]=(int *)malloc( sizeof(int)*5 );}for(i=0;i<3;i++)for(j=0;j<5;j++){p[i][j]=3;}printf("p[2][3]=%d\n",p[2][3]);return 0;
}
[root@localhost 01_pthread_test]# ./ex2
p[2][3]=3
分析:
強調一點:數組名、函數名等類似的東西都不是指針!!!只是在使用的時候它們被隱式轉換為了指針。一維數組:int a[10]; sizeof(a)中,a就沒有轉換為指針,a指的就是數組本身 ,sizeof(a)的結果為40(40bytes)。如果對a的操作中涉及元素的操作時,由于僅僅指出a系統并不清楚要具體取哪一個元素,因此直接返回給數組的首地址,即a被隱式轉換為數組的第一個元素的地址&a[0]。二維數組:int a[10][9]; 其本質就是一個一維數組(數組的數組),在內存中的分布是一維的,一行緊接著一行連續分布:即a[0][8]的后面緊接著就是a[1][0]。a[10][9]可以看成是a[0]、a[1]、······、a[9]這十個元素構成的數組,其中a[0]是二維數組的首元素;而a[0]、a[1]、······、a[9]這十個元素中每一個元素又是一個數組(類型為int [9]),即a[0]代表:a[0][0]~a[0][8]。因此在隱式轉換時:a被隱式轉換為二維數組第一個元素的首地址,即a=&a[0],a的步長為36bytes,指向的是a[0]這個數組(這一行);而a[0]如果進行隱式轉換,則轉換為a[0]這個一維數組的首地址,即&a[0][0]。注意,a與a[0]隱式轉換后值是相等的,但是步長不一樣,a[0]轉換后,所指向的內容是a[0][0],即int類型,因此步長為4bytes。因此a與a[0]的指針值雖然是相等的,但是步長不一樣,即:a+1與a[0]+1不相等。a+1指向的是a[1][0],a[0]+1指向的是a[0][1]。
在上面程序ex.c中。p、&a、a、a[0]、*a、a+1、a[0]+1、a[1]、&a[0][0]、*(&a[0][0])、*(*a)。p是一個二級指針,最終地址內容為int型數值;&a為int (*)[3][5]類型,即指向整個二維數組;a是整個數組,隱式轉換為指向a[0]的指針,int (*)[5]類型;a[0]是一維數組,隱式轉換為指向a[0][0]的指針,int *類型;*a經歷了兩次隱式轉換,第一次a被轉換,第二次*a被轉換,最終為指向a[0][0]的指針,為int *類型;a+1,int (*)[5]類型;a[0]+1,int *類型;a[1],int *類型;&a[0][0],int *類型。根據上面程序輸出結果可以判斷。若p=a,則&p,int ***類型;p,int **類型;*p為int*內容;此時程序可以輸出結果(不會發生錯誤),但是結果毫無意義。*(*p)則會發生段錯誤,因此*p地址的內容用戶未定義,非法訪問內存。
程序ex2.c描述了另一種方法將二級指針表示二維數組。