參考鏈接：Structure pointer pointing to different structure instance
注：可以查看此篇的問題和唯一的回復，那是相對正確的，不要看comment，有很多錯誤。

我是拒絕分析這種問題的，因為似乎沒有人會這么亂用，但是……在華保健老師的編譯原理示例代碼和Linux0.11內核中，就遇到了這么神奇的代碼，那就不得不研究一下了！畢竟是大神寫的代碼，我不知道應該是我渣。

1 測試代碼

#include <stdio.h>
#include <stdlib.h>struct A {char a;int b;
};struct B {int c;int d;
};struct C {int e;char f;
};int main() {struct A a = { 'a', 100 };struct B b = { 101, 300 };struct C c = { 200,'c' };// 根據字節對齊，都占據8字節printf("A: size %d  %c  %d\n", sizeof(a), a.a, a.b);printf("B: size %d  %d  %d\n", sizeof(b), b.c, b.d);printf("C: size %d  %d  %c\n", sizeof(c), c.e, c.f);struct A *ap = &b; // A結構體指針，指向結構體Bprintf("%d %d\n",ap->a, ap->b);printf("%c %d\n", ap->a, ap->b);char *chp = &b;chp[1] = 'b';  // 這塊區域其實是字節對齊導致的空閑空間printf("%d %d\n", ap->a, ap->b);printf("%c %d\n", ap->a, ap->b);/* 如何訪問這塊內存，取決于ap指針，能訪問多大地方，取決于內存區域本身 */ap->a = 'c';  // ap->a = 'c'就是相當于 char a = 'c';ap->a = 1000; // ap->a = 1000 就是相當于 char a = 1000; 1000過大會被截斷高位ap->b = 3000; // ap->b <=> int b ...struct C *cp = &b; // C結構體指針，指向結構體Bprintf("%d %d\n", cp->e, cp->f);printf("%d %c\n", cp->e, cp->f);cp->e = 3000;cp->f = 'e';cp->f = 1000;// 整形指針指向結構體Aint *bp = &a;bp[0] = 1000;bp[1] = 2000;printf("A: %c  %d\n", a.a, a.b);printf("A: %d  %d\n", a.a, a.b);bp[2] = 2000;	// 可以修改內存，但是堆棧溢出，// 因為該空間沒有被分配（局部變量是保存在堆棧中的）return 0;
}

2 結構體占據空間問題 & 字節對齊

struct A {char a;int b;
};struct B {int c;int d;
};struct C {int e;char f;
};...
struct A a = { 'a', 100 };
struct B b = { 101, 300 };
struct C c = { 200,'c' };// 根據字節對齊，都占據8字節
printf("A: size %d  %c  %d\n", sizeof(a), a.a, a.b);
printf("B: size %d  %d  %d\n", sizeof(b), b.c, b.d);
printf("C: size %d  %d  %c\n", sizeof(c), c.e, c.f);
...

運行以上程序，我們可以直到，三個結構體分別創建了一個變量，并且每個結構體占據的空間大小都是8字節。

在這里插入圖片描述
至于為什么都是8字節，這是內存對齊問題，不展開說明了，我們看看這幾個結構體被分配的空間情況吧。

在這里插入圖片描述

每個結構體都占8字節的內存空間
紅色部分表示實際占用的空間
藍色部分表示空閑空間

注意：這就意味著，凡是被分配的8字節空間，是可以任意訪問的，而空間外面是不允許訪問的。

讓結構體A的指針ap，指向結構體B的變量b

現在我們建立一個結構體A的指針，讓其指向b。

struct A *ap = &b; // A結構體指針，指向結構體B
printf("%d %d\n",ap->a, ap->b);
printf("%c %d\n", ap->a, ap->b);

在這里插入圖片描述
我們看看內存的情況，再分析一下打印的結果。

在這里插入圖片描述

上面是內存的分布情況，現在

訪問ap->a打印出來的是：101，e
訪問ap->b打印出來的是300

所以ap指針實際訪問的應該是下面重點標出的部分：
在這里插入圖片描述

而這部分，是不是很熟悉？
在這里插入圖片描述

所以，ap指針盡管指向了結構體B，但是實際還是按照結構體A的結構訪問內存的。

2.1 使用char指針指向結構體B

剛才我們發現，使用結構體A的指針，可以直接訪問結構體B，那么，如果是基本數據類型呢？我們試一下。

char *chp = &b;
chp[1] = 'b';  // 這塊區域其實是字節對齊導致的空閑空間
printf("%d %d\n", ap->a, ap->b);
printf("%c %d\n", ap->a, ap->b);

在這里插入圖片描述
我們看到內存分布如上圖，現在執行chp[1] = 'b'（b的ASCII碼是62）

之后就變成了：

在這里插入圖片描述

哦！這是令人驚訝的，char類型的指針指向了一塊內存區域，然后使用下標修改了內存的值！

還記得動態數組申請嗎？和內個是一樣的原理！

int *a = (int *)malloc(sizeof(int) * 10);
a[0] = 1; // 使用下標訪問
a[1] = 2;
...
free(a);

告訴我們兩件事

指針默認指向最開始的元素，索引是0
使用下標索引可以依次訪問后面的元素，每次向后移動的內存數，取決于指針的數據類型

所以上面的事情不難理解。

然后我們繼續執行程序

printf("%d %d\n", ap->a, ap->b);
printf("%c %d\n", ap->a, ap->b);

在這里插入圖片描述

盡管之前的空閑空間改變了，但是結果依然不變，也就是說我們之前的說法是正確的。

在這里插入圖片描述

再進一步驗證

/* 如何訪問這塊內存，取決于ap指針，能訪問多大地方，取決于內存區域本身 */
ap->a = 'c';  // ap->a = 'c'就是相當于 char a = 'c';
ap->a = 1000; // ap->a = 1000 就是相當于 char a = 1000; 1000過大會被截斷高位
ap->b = 3000; // ap->b <=> int b ...

結果顯而易見，對于ap->a = 1000，盡管1000已經超過了1字節大小，但是最終只修改了第一個字節，這就好比char a = 1000一樣，a = 0xe8

在這里插入圖片描述

是的，1000 = 0x3e8，但是只有一個字節，所以最高位的3被舍棄了。

2.2 用結構體C指針cp指向結構體B

struct C *cp = &b; // C結構體指針，指向結構體B
printf("%d %d\n", cp->e, cp->f);
printf("%d %c\n", cp->e, cp->f);cp->e = 3000;
cp->f = 'e';
cp->f = 1000;

我們再試一試！

最終結果顯而易見。

在這里插入圖片描述

2.3 用int指針指向結構體A

// 整形指針指向結構體A
int *bp = &a;
bp[0] = 1000;
bp[1] = 2000;
printf("A: %c  %d\n", a.a, a.b);
printf("A: %d  %d\n", a.a, a.b);
bp[2] = 2000;	// 可以修改內存，但是堆棧溢出，// 因為該空間沒有被分配（局部變量是保存在堆棧中的）

其實這個事情我們之前干過了，之前用char，現在用int再干一下。

在這里插入圖片描述

這個事情進一步說明了什么呢？

a提供了有限的8字節內存空間
bp指針能夠修改哪里，取決于它指向的地址；一次修改多大空間，取決于它數據類型的大小
指針不能修改未被分配的空間，最后bp[2]訪問了外界空間，因此產生了

因為局部變量都是被分配在棧中的，現在這個局部變量訪問越界了，產生了錯誤，棧被破壞。

棧破壞這里情況非常復雜，先粗淺理解為，使用了未分配的空間導致了錯誤吧。

Linux0.11 內核中，使用上述方法，實現了GDT和IDT。

3 小結：精華在這里

分析了這么多，最終小結一下吧。

我們的眼中只有兩件事

已分配的內存空間
某數據類型的指針

現在，我們就讓指針指向內存空間的起始地址，然后就可以操作這個內存空間了。

再增加一些限制

內存空間就這么大，不能訪問外面
指針每次訪問的地址，是通過下標訪問的，一次只能移動數據類型大小的整數倍

在這里插入圖片描述

這個時候你眼中的C語言，分配一塊內存，再創建一個指針，打遍天下無敵手！

當然了，除了特殊情況一般沒人這么干，你會瘋掉，看你代碼的人也會瘋掉！

4 補充：直接深入底層，看匯編代碼

之前我們的分析是基于C語言層級的，比較抽象，實際上，編譯完成之后的匯編語言，一看就明白了。
在這里插入圖片描述

你可以看到ap->a直接訪問的是byte，而ap->b訪問的是dword，一個是字節，一個是雙字，大小自然清晰。

這也是編譯器的功能，把C語言提供的，方便人類使用的大量抽象，給翻譯成方便機器使用的少量指令的復雜排列組合。

5 什么叫打遍天下無敵手呢？

其實就是瞎玩兒吧……但是的確可以這么干的！我們試一試。

int main() {char aaa[4] = { 1,2,3,4 };char aaa2[4] = { 1,2,3,4 };int *bbb = &aaa;printf("\n\n%x\n\n\n", bbb[0]);return 0;
}

會打印什么呢？顯而易見的！內存是01 02 03 04，然后一個int *指針訪問了它，打印04030201。

在這里插入圖片描述

我們可以使用bbb[0]或者*b都行，因為b指向起始地址。

那，能不能通過bbb[1]訪問aaa2的內存呢？

不行！ 因為aaa1和aaa2是兩個數組變量，他們在內存中的位置不是連續的，是隨機的，如果你想達到內種效果，那就是前面提到的結構體了，把這兩個放進一個結構體里面，就是連續分配內存了，就能使用bbb[1]了。

最后，記住只有兩件事

一塊已分配的內存
一個指針

【精華文】C語言結構體特殊情況分析：結構體指針 / 基本數據類型指針，指向其他結構體

1 測試代碼

2 結構體占據空間問題 & 字節對齊

讓結構體A的指針ap，指向結構體B的變量b

2.1 使用char指針指向結構體B

2.2 用結構體C指針cp指向結構體B

2.3 用int指針指向結構體A

3 小結：精華在這里

4 補充：直接深入底層，看匯編代碼

5 什么叫打遍天下無敵手呢？

相關文章

enum in c language

信號量SIGCHLD的使用，如何讓父進程得知子進程執行結束，如何讓父進程區分多個子進程的結束

使用gdb調試多進程程序、同時調試父進程和子進程

Linux安裝Ncurses庫

gdb 10.2的安裝

gdb tui的使用

C語言中信號函數（signal）的使用

UNIX哲學

fork創建多個子進程

wait系統調用

Linux進程間通信：共享內存與管道

find command基本使用

正則表達式特別需要注意的點：“空“字符的匹配

vim多列操作--插入/刪除

vim進行行內某部分的復制剪切粘貼

函數調用堆棧

gdb調試的幾點提示（1）

C語言讀取文件

Vivado提高綜合和實現的速度

安裝Ubuntu RISC V toolchain失敗（網速、git配置原因）