C語言編譯過程總結詳解

源文:http://bbs.dzsc.com/space/viewspacepost.aspx?postid=76976

C語言的編譯鏈接過程要把我們編寫的一個c程序(源代碼)轉換成可以在硬件上運行的程序(可執行代碼),需要進行編譯和鏈接。編譯就是把文本形式源代碼翻譯為機器語言形式的目標文件的過程。鏈接是把目標文件、操作系統的啟動代碼和用到的庫文件進行組織形成最終生成可執行代碼的過程。過程圖解如下:


  從圖上可以看到,整個代碼的編譯過程分為編譯和鏈接兩個過程,編譯對應圖中的大括號括起的部分,其余則為鏈接過程。


  編譯過程


  編譯過程又可以分成兩個階段:編譯和匯編。


  編譯


  編譯是讀取源程序(字符流),對之進行詞法和語法的分析,將高級語言指令轉換為功能等效的匯編代碼,源文件的編譯過程包含兩個主要階段:

  第一個階段是預處理階段,在正式的編譯階段之前進行。預處理階段將根據已放置在文件中的預處理指令來修改源文件的內容。如#include指令就是一個預處理指令,它把頭文件的內容添加到.cpp文件中。這個在編譯之前修改源文件的方式提供了很大的靈活性,以適應不同的計算機和操作系統環境的限制。一個環境需要的代碼跟另一個環境所需的代碼可能有所不同,因為可用的硬件或操作系統是不同的。在許多情況下,可以把用于不同環境的代碼放在同一個文件中,再在預處理階段修改代碼,使之適應當前的環境。


  主要是以下幾方面的處理:


  (1)宏定義指令,如 #define a? b


  對于這種偽指令,預編譯所要做的是將程序中的所有a用b替換,但作為字符串常量的 a則不被替換。還有 #undef,則將取消對某個宏的定義,使以后該串的出現不再被替換。


  (2)條件編譯指令,如#ifdef,#ifndef,#else,#elif,#endif等。


  這些偽指令的引入使得程序員可以通過定義不同的宏來決定編譯程序對哪些代碼進行處理。預編譯程序將根據有關的文件,將那些不必要的代碼過濾掉。

  (3) 頭文件包含指令,如#include "FileName"或者#include <FileName>等。


  在頭文件中一般用偽指令#define定義了大量的宏(最常見的是字符常量),同時包含有各種外部符號的聲明。采用頭文件的目的主要是為了使某些定義可以供多個不同的C源程序使用。因為在需要用到這些定義的C源程序中,只需加上一條#include語句即可,而不必再在此文件中將這些定義重復一遍。預編譯程序將把頭文件中的定義統統都加入到它所產生的輸出文件中,以供編譯程序對之進行處理。包含到c源程序中的頭文件可以是系統提供的,這些頭文件一般被放在 /usr/include目錄下。在程序中#include它們要使用尖括號(< >)。另外開發人員也可以定義自己的頭文件,這些文件一般與c源程序放在同一目錄下,此時在#include中要用雙引號("")。


  (4)特殊符號,預編譯程序可以識別一些特殊的符號。


  例如在源程序中出現的LINE標識將被解釋為當前行號(十進制數),FILE則被解釋為當前被編譯的C源程序的名稱。預編譯程序對于在源程序中出現的這些串將用合適的值進行替換。


  預編譯程序所完成的基本上是對源程序的“替代”工作。經過此種替代,生成一個沒有宏定義、沒有條件編譯指令、沒有特殊符號的輸出文件。這個文件的含義同沒有經過預處理的源文件是相同的,但內容有所不同。下一步,此輸出文件將作為編譯程序的輸出而被翻譯成為機器指令。


  第二個階段編譯、優化階段,經過預編譯得到的輸出文件中,只有常量;如數字、字符串、變量的定義,以及C語言的關鍵字,如main,if,else,for,while,{,}, +,-,*,\等等。


  編譯程序所要作得工作就是通過詞法分析和語法分析,在確認所有的指令都符合語法規則之后,將其翻譯成等價的中間代碼表示或匯編代碼。

  優化處理是編譯系統中一項比較艱深的技術。它涉及到的問題不僅同編譯技術本身有關,而且同機器的硬件環境也有很大的關系。優化一部分是對中間代碼的優化。這種優化不依賴于具體的計算機。另一種優化則主要針對目標代碼的生成而進行的。


  對于前一種優化,主要的工作是刪除公共表達式、循環優化(代碼外提、強度削弱、變換循環控制條件、已知量的合并等)、復寫傳播,以及無用賦值的刪除,等等。


  后一種類型的優化同機器的硬件結構密切相關,最主要的是考慮是如何充分利用機器的各個硬件寄存器存放的有關變量的值,以減少對于內存的訪問次數。另外,如何根據機器硬件執行指令的特點(如流水線、RISC、CISC、VLIW等)而對指令進行一些調整使目標代碼比較短,執行的效率比較高,也是一個重要的研究課題。


  匯編


  匯編實際上指把匯編語言代碼翻譯成目標機器指令的過程。對于被翻譯系統處理的每一個C語言源程序,都將最終經過這一處理而得到相應的目標文件。目標文件中所存放的也就是與源程序等效的目標的機器語言代碼。目標文件由段組成。通常一個目標文件中至少有兩個段:


  代碼段:該段中所包含的主要是程序的指令。該段一般是可讀和可執行的,但一般卻不可寫。


  數據段:主要存放程序中要用到的各種全局變量或靜態的數據。一般數據段都是可讀,可寫,可執行的。


  UNIX環境下主要有三種類型的目標文件:


  (1)可重定位文件


  其中包含有適合于其它目標文件鏈接來創建一個可執行的或者共享的目標文件的代碼和數據。


  (2)共享的目標文件


  這種文件存放了適合于在兩種上下文里鏈接的代碼和數據。第一種是鏈接程序可把它與其它可重定位文件及共享的目標文件一起處理來創建另一個 目標文件;第二種是動態鏈接程序將它與另一個可執行文件及其它的共享目標文件結合到一起,創建一個進程映象。


  (3)可執行文件


  它包含了一個可以被操作系統創建一個進程來執行之的文件。匯編程序生成的實際上是第一種類型的目標文件。對于后兩種還需要其他的一些處理方能得到,這個就是鏈接程序的工作了。


  鏈接過程


  由匯編程序生成的目標文件并不能立即就被執行,其中可能還有許多沒有解決的問題。


  例如,某個源文件中的函數可能引用了另一個源文件中定義的某個符號(如變量或者函數調用等);在程序中可能調用了某個庫文件中的函數,等等。所有的這些問題,都需要經鏈接程序的處理方能得以解決。


  鏈接程序的主要工作就是將有關的目標文件彼此相連接,也即將在一個文件中引用的符號同該符號在另外一個文件中的定義連接起來,使得所有的這些目標文件成為一個能夠誒操作系統裝入執行的統一整體。


  根據開發人員指定的同庫函數的鏈接方式的不同,鏈接處理可分為兩種:


  (1)靜態鏈接


  在這種鏈接方式下,函數的代碼將從其所在地靜態鏈接庫中被拷貝到最終的可執行程序中。這樣該程序在被執行時這些代碼將被裝入到該進程的虛擬地址空間中。靜態鏈接庫實際上是一個目標文件的集合,其中的每個文件含有庫中的一個或者一組相關函數的代碼。


  (2) 動態鏈接


  在此種方式下,函數的代碼被放到稱作是動態鏈接庫或共享對象的某個目標文件中。鏈接程序此時所作的只是在最終的可執行程序中記錄下共享對象的名字以及其它少量的登記信息。在此可執行文件被執行時,動態鏈接庫的全部內容將被映射到運行時相應進程的虛地址空間。動態鏈接程序將根據可執行程序中記錄的信息找到相應的函數代碼。


  對于可執行文件中的函數調用,可分別采用動態鏈接或靜態鏈接的方法。使用動態鏈接能夠使最終的可執行文件比較短小,并且當共享對象被多個進程使用時能節約一些內存,因為在內存中只需要保存一份此共享對象的代碼。但并不是使用動態鏈接就一定比使用靜態鏈接要優越。在某些情況下動態鏈接可能帶來一些性能上損害。


  我們在linux使用的gcc編譯器便是把以上的幾個過程進行捆綁,使用戶只使用一次命令就把編譯工作完成,這的確方便了編譯工作,但對于初學者了解編譯過程就很不利了,下圖便是gcc代理的編譯過程:


  從上圖可以看到:

  預編譯

  將.c 文件轉化成 .i文件

  使用的gcc命令是:gcc –E

  對應于預處理命令cpp

  編譯

  將.c/.h文件轉換成.s文件

  使用的gcc命令是:gcc –S

  對應于編譯命令?? cc –S

  匯編

  將.s 文件轉化成 .o文件

  使用的gcc 命令是:gcc –c

  對應于匯編命令是? as

  鏈接

  將.o文件轉化成可執行程序

  使用的gcc 命令是: gcc

  對應于鏈接命令是? ld

  總結起來編譯過程就上面的四個過程:預編譯、編譯、匯編、鏈接。Lia了解這四個過程中所做的工作,對我們理解頭文件、庫等的工作過程是有幫助的,而且清楚的了解編譯鏈接過程還對我們在編程時定位錯誤,以及編程時盡量調動編譯器的檢測錯誤會有很大的幫助的。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/449644.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/449644.shtml
英文地址,請注明出處:http://en.pswp.cn/news/449644.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

DataFrame合并

獲取數據后&#xff0c;需要對數據進行合并&#xff0c;通常是日期&#xff0c;也有對相同公司進行合并 下面就研究數據合并的常用方法&#xff1a; 目錄 append merge concat 首先創建幾個DataFrame&#xff0c;作為樣本材料進行練習&#xff1a; df1 pd.DataFrame(np…

回顧小程序2018年三足鼎立歷程,2019年BAT火力全開

從 2018 年開年&#xff0c;小程序就成為了互聯網巨頭加緊布局的開始。微信小程序先發制人&#xff0c;且擁有 10 億月活躍用戶&#xff0c;如此巨大的流量往往使眾多后來者望而卻步。 但這里不包括阿里和百度。其實螞蟻金服團隊早在 2017 年 9 月便開始籌劃小程序&#xff0c;…

promise之我見

在我們平時的方法中有很多方法是promise封裝的&#xff0c; 有些函數后邊跟的then和catch 就是promise的方法&#xff0c;先看一下pormise的特點 &#xff08;1&#xff09;對象的狀態不受外界影響。Promise對象代表一個異步操作&#xff0c;有三種狀態&#xff1a;pending&…

2020-11-26

import datetime last[date] last[date].apply(lambda x:datetime.datetime.strptime(str(x),%Y%m%d).strftime(%Y/%m/%d)) cu.rename(columns{"Unnamed: 0":"date"},inplaceTrue) traindatapd.DataFrame(traindata,dtypenp.float) list 轉化Data Frame …

CPP虛析構函數

#include<iostream> using namespace std;class base {public:base(){};virtual ~base(){}; };// 在類聲明中聲明純虛析構函數 //base::~base() {}class father: public base {public:~father(){cout << "father" << endl;} };int main() {base* a…

學習過程中的一些想法

2019.01.18 問題描述&#xff1a;在學習響應式布局視頻教程的時候&#xff0c;遇到了一些不是特別明白的知識點&#xff0c;比如&#xff1a;媒體查詢、視口&#xff0c;視頻中會講解使用的那一部分東西&#xff0c;不太影響我繼續看視頻&#xff08;能大概理解&#xff09;&am…

idea 新建springboot 的 web 項目

前些天發現了一個巨牛的人工智能學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家。點擊跳轉到教程。 IDAE中新建web項目見&#xff1a;IntelliJ IDEA中新建JAVA WEB項目、maven項目 默認已有一個 maven 的 web 項目&#xff1a;gentle --…

PHP工程師需要掌握的知識(轉載)

掌握PHP基礎、文件操作、面向對象編程、CURL擴展。掌握Linux環境下面LAMP環境搭建、LNMP環境搭建。了解基本的HTTP協議和計算機網絡知識。熟悉常用的算法與數據結構知識&#xff0c;隊列、棧、隊、圖、樹、排序算法等。熟悉前端HTML、CSS、jQuery、BootStarp等知識。熟悉常用的…

讀碼,解碼,轉換

import chardet f open(ff2.csv,rb) data f.read() chardet.detect(data){encoding: GB2312, confidence: 0.99, language: Chinese}

從全棧式解決方案到情感化,揭秘問眾智能切入車載語音市場的最佳姿勢...

*問眾智能CEO張亞 如果說語音交互是車載場景的最佳方式&#xff0c;未來誰掌握車內語音交互“話語權”&#xff0c;誰就將主宰車輛智能網聯的新時代。 經過多年的漸進式發展&#xff0c;語音交互的價值正逐步走出單純“控制方式”的狹隘理解&#xff0c;向業內人眼中的“智能…

浮想——我和CSDN走過了3個時代(長文,無耐心讀完者勿入)

上周末公司年會&#xff0c;董事長蔣濤同學分享了他13年的創業經歷。 算起來&#xff0c;這已經是我第1、2、3、4、5、6、7年參加CSDN的年會了。場面上&#xff0c;這也是最大的一次&#xff0c;也是蔣濤同學講話時間最長的一次。下午時光&#xff0c;寶貝正在我懷里沉沉的睡著…

CentOS7的yum安裝mysql

前些天發現了一個巨牛的人工智能學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家。點擊跳轉到教程。 一、mariadb 查看CentOS7中是否已經安裝了mariadb數據庫,若安裝了mariadb數據庫&#xff0c;先卸載mariadb數據再安裝MySQL。若沒有安裝m…

3530: [Sdoi2014]數數

3530: [Sdoi2014]數數 鏈接 分析&#xff1a; 對給定的串建立AC自動機&#xff0c;然后數位dp。數位dp的過程中&#xff0c;記錄當前在AC自動機的哪個點上&#xff0c;保證不能走到出現了給定串的點。 代碼&#xff1a; #include<cstdio> #include<algorithm> #inc…

阿里云日志添加要查詢字段

第一步&#xff1a;在API基控制器&#xff08;base文件下&#xff09;下面 $arr 就是我要接受的所有參數值&#xff0c;而 msg_id就是我以后要在阿里云日志中查詢的字段&#xff0c;以此字段統計某些數據 $arr 是前臺API接口傳過來的數據 &#xff0c;這里我需要使用 $arr[id] …

總理整節從事量化交易員所做工作與代碼

數據獲取&#xff08;期權數據&#xff09; 本人從事領域為量化期權領域&#xff08;皇冠上的明珠&#xff0c;真好聽&#xff0c;可是做起來&#xff0c;難度真是&#xff08;滴-------------&#xff09;&#xff09;。從最開始的手動從三大所復制粘貼期權數據&#xff0c;到…

Docker 上安裝、啟動 MySQL (圖解)

前些天發現了一個巨牛的人工智能學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家。點擊跳轉到教程。 1. 在docker倉庫中搜索mysql的鏡像&#xff1a; docker search mysql 下載鏡像&#xff1a; docker pull mysql 2. 查看本地鏡…

關于 std::set/std::map 的幾個為什么

2013-01-20 std::set/std::map &#xff08;以下用 std::map 代表&#xff09; 是常用的關聯式容器&#xff0c;也是 ADT&#xff08;抽象數據類型&#xff09;。也就是說&#xff0c;其接口&#xff08;不是 OO 意義下的 interface&#xff09;不僅規定了操作的功能&#xff…

HDU 3572 Task Schedule

傳送門 作業調度&#xff0c;這道題還真沒想到能用網絡流。。。。乍一看跟背包問題差不多。 有N個作業&#xff0c;M個機器&#xff0c;每個作業給你一個耗費時間&#xff08;時間段&#xff09;以及最早開始時間和最晚完成時間&#xff08;這兩個是時間點&#xff09;&#xf…

MariaDB安裝1,2

2019獨角獸企業重金招聘Python工程師標準>>> 4.22 MariaDB安裝 MariaDB是MySQL的一個分支。MySQL——>sun——>Oracle&#xff0c;維基百科&#xff1a;https://en.wikipedia.org/wiki/MariaDB 官網&#xff1a;https://mariadb.org MariaDB 10.3.11Linux64位…

CentOS 7 上 Docker 安裝

前些天發現了一個巨牛的人工智能學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家。點擊跳轉到教程。 Docker支持以下的CentOS版本&#xff1a; CentOS 7 (64-bit)CentOS 6.5 (64-bit) 或更高的版本前提條件 目前&#xff0c;CentOS 僅發…