深入研究Clang(四) Clang編譯器的簡單分析

作者:史寧寧(snsn1984)

首先我們確定下Clang編譯器的具體內容和涵蓋范圍。之前在《LLVM每日談之二十 Everything && Clang driver 》中曾經提到過,Clang driver(命令行表示是clang)和Clang前端(按照具體實現來說就是Clang的那些庫所實現的前端)是不同的,同時還存在一個Clang編譯器(命令行表示是clang -cc1)。Clang編譯器不僅僅包含了Clang前端,還包括使用LLVM的哭實現的編譯器的中間階段以及后端,同時也集成了assembler。

Clang driver有一系列的frontend action,這些frontend action定義于clang/include/clang/Frontend/FrontendOptions.h中的ActionKind枚舉中。其中一些frontend action就會觸發Clang編譯器(clang -cc1),比如:ASTView, EmitBC, EmitObj等。一旦觸發了Clang編譯器(clang -cc1),就會執行函數cc1_main()(clang/tools/driver/cc1_main.cpp),從名字上就可以看出來,這個函數是Clang編譯器(clang -cc1)的入口主函數。

舉個具體的例子來看一下:

min.c

int min(int a, int b) {if (a < b) {return a;}return b;
}

運行命令: clang -### min.c -o min

clang version 3.5.0 (tags/RELEASE_350/final)
Target: x86_64-unknown-linux-gnu
Thread model: posix"/home/shining/llvm-3.5/build/bin/clang-3.5" "-cc1" "-triple" "x86_64-unknown-linux-gnu" "-emit-obj" "-mrelax-all" "-disable-free" "-main-file-name" "min.c" "-mrelocation-model" "static" "-mdisable-fp-elim" "-fmath-errno" "-masm-verbose" "-mconstructor-aliases" "-munwind-tables" "-fuse-init-array" "-target-cpu" "x86-64" "-dwarf-column-info" "-resource-dir" "/home/shining/llvm-3.5/build/bin/../lib/clang/3.5.0" "-internal-isystem" "/usr/local/include" "-internal-isystem" "/home/shining/llvm-3.5/build/bin/../lib/clang/3.5.0/include" "-internal-externc-isystem" "/usr/include/x86_64-linux-gnu" "-internal-externc-isystem" "/include" "-internal-externc-isystem" "/usr/include" "-fdebug-compilation-dir" "/home/shining/llvm-3.5/build/bin" "-ferror-limit" "19" "-fmessage-length" "80" "-mstackrealign" "-fobjc-runtime=gcc" "-fdiagnostics-show-option" "-o" "/tmp/min-75c13b.o" "-x" "c" "min.c""/usr/bin/ld" "-z" "relro" "--hash-style=gnu" "--build-id" "--eh-frame-hdr" "-m" "elf_x86_64" "-dynamic-linker" "/lib64/ld-linux-x86-64.so.2" "-o" "min" "/usr/lib/gcc/x86_64-linux-gnu/4.8/../../../x86_64-linux-gnu/crt1.o" "/usr/lib/gcc/x86_64-linux-gnu/4.8/../../../x86_64-linux-gnu/crti.o" "/usr/lib/gcc/x86_64-linux-gnu/4.8/crtbegin.o" "-L/usr/lib/gcc/x86_64-linux-gnu/4.8" "-L/usr/lib/gcc/x86_64-linux-gnu/4.8/../../../x86_64-linux-gnu" "-L/lib/x86_64-linux-gnu" "-L/lib/../lib64" "-L/usr/lib/x86_64-linux-gnu" "-L/usr/lib/gcc/x86_64-linux-gnu/4.8/../../.." "-L/home/shining/llvm-3.5/build/bin/../lib" "-L/lib" "-L/usr/lib" "/tmp/min-75c13b.o" "-lgcc" "--as-needed" "-lgcc_s" "--no-as-needed" "-lc" "-lgcc" "--as-needed" "-lgcc_s" "--no-as-needed" "/usr/lib/gcc/x86_64-linux-gnu/4.8/crtend.o" "/usr/lib/gcc/x86_64-linux-gnu/4.8/../../../x86_64-linux-gnu/crtn.o"
-###參數是為了查看,clang driver到底調用了哪些命令,并且不會執行這些命令。從這里可以實際看到,實際上調用的是 clang-3.5 -cc1,其中3.5是版本號,所以其實調用的就是clang編譯器。之后又調用了系統的ld loader,因為LLVM架構的loader還在開發之中。

所以,對于那些我們已經明確需要clang編譯器去作的工作,我們可以不通過clang driver去隱式調用(比如上面的例子),而是直接在命令行調用clang -cc1去執行,并且在clang -cc1之后跟clang編譯器接受的參數。也可以通過clang -Xclang就可以直接將參數傳遞給clang編譯器(clang -cc1)。下面的具體實現,將同時給出這兩種的命令行形式,其實運行結果幾乎是完全相同的。不同的是,使用clang -Xclang的時候,如果不加強制的參數,這里雖然-Xclang將參數傳遞給了clang -cc1,但是這里的clang driver依然會繼續工作的。在下面的例子中會進行分別的展示

編譯器首先進行的是詞法分析,我們可以通過命令行去查看進行詞法分析之后的token序列到底是怎么樣的,仍然以上面的min.c為例,運行命令:

clang -cc1 -dump-tokens min.c

運行之后得到如下輸出:

int 'int'	 [StartOfLine]	Loc=<min.c:1:1>
identifier 'min'	 [LeadingSpace]	Loc=<min.c:1:5>
l_paren '('		Loc=<min.c:1:8>
int 'int'		Loc=<min.c:1:9>
identifier 'a'	 [LeadingSpace]	Loc=<min.c:1:13>
comma ','		Loc=<min.c:1:14>
int 'int'	 [LeadingSpace]	Loc=<min.c:1:16>
identifier 'b'	 [LeadingSpace]	Loc=<min.c:1:20>
r_paren ')'		Loc=<min.c:1:21>
l_brace '{'	 [LeadingSpace]	Loc=<min.c:1:23>
if 'if'	 [StartOfLine] [LeadingSpace]	Loc=<min.c:2:5>
l_paren '('	 [LeadingSpace]	Loc=<min.c:2:8>
identifier 'a'		Loc=<min.c:2:9>
less '<'	 [LeadingSpace]	Loc=<min.c:2:11>
identifier 'b'	 [LeadingSpace]	Loc=<min.c:2:13>
r_paren ')'		Loc=<min.c:2:14>
l_brace '{'	 [LeadingSpace]	Loc=<min.c:2:16>
return 'return'	 [StartOfLine] [LeadingSpace]	Loc=<min.c:3:9>
identifier 'a'	 [LeadingSpace]	Loc=<min.c:3:16>
semi ';'		Loc=<min.c:3:17>
r_brace '}'	 [StartOfLine] [LeadingSpace]	Loc=<min.c:4:5>
return 'return'	 [StartOfLine] [LeadingSpace]	Loc=<min.c:5:5>
identifier 'b'	 [LeadingSpace]	Loc=<min.c:5:12>
semi ';'		Loc=<min.c:5:13>
r_brace '}'	 [StartOfLine]	Loc=<min.c:6:1>
eof ''		Loc=<min.c:6:2>
或者選用: clang -Xclang -dump-tokens min.c

輸出信息如下:

int 'int'	 [StartOfLine]	Loc=<min.c:1:1>
identifier 'min'	 [LeadingSpace]	Loc=<min.c:1:5>
l_paren '('		Loc=<min.c:1:8>
int 'int'		Loc=<min.c:1:9>
identifier 'a'	 [LeadingSpace]	Loc=<min.c:1:13>
comma ','		Loc=<min.c:1:14>
int 'int'	 [LeadingSpace]	Loc=<min.c:1:16>
identifier 'b'	 [LeadingSpace]	Loc=<min.c:1:20>
r_paren ')'		Loc=<min.c:1:21>
l_brace '{'	 [LeadingSpace]	Loc=<min.c:1:23>
if 'if'	 [StartOfLine] [LeadingSpace]	Loc=<min.c:2:5>
l_paren '('	 [LeadingSpace]	Loc=<min.c:2:8>
identifier 'a'		Loc=<min.c:2:9>
less '<'	 [LeadingSpace]	Loc=<min.c:2:11>
identifier 'b'	 [LeadingSpace]	Loc=<min.c:2:13>
r_paren ')'		Loc=<min.c:2:14>
l_brace '{'	 [LeadingSpace]	Loc=<min.c:2:16>
return 'return'	 [StartOfLine] [LeadingSpace]	Loc=<min.c:3:9>
identifier 'a'	 [LeadingSpace]	Loc=<min.c:3:16>
semi ';'		Loc=<min.c:3:17>
r_brace '}'	 [StartOfLine] [LeadingSpace]	Loc=<min.c:4:5>
return 'return'	 [StartOfLine] [LeadingSpace]	Loc=<min.c:5:5>
identifier 'b'	 [LeadingSpace]	Loc=<min.c:5:12>
semi ';'		Loc=<min.c:5:13>
r_brace '}'	 [StartOfLine]	Loc=<min.c:6:1>
eof ''		Loc=<min.c:6:2>
/usr/bin/ld: cannot find /tmp/min-3cce9d.o: No such file or directory
clang-3.5: error: linker command failed with exit code 1 (use -v to see invocation)
明顯可以看到,使用-Xclang的時候,把-dump-tokens參數傳遞給了clang -cc1,但是clang driver依然工作,并且調用了ld.

可以使用clang -### -Xclang -dump-tokens min.c命令進行驗證。

看過了詞法分析階段,我們再看下clang編譯器語法分析來的AST nodes。

使用命令:clang -cc1 -fsyntax-only -ast-dump min.c

或者:clang -fsyntax-only -Xclang -ast-dump min.c

輸出結果一樣:

TranslationUnitDecl 0x6bc3a40 <<invalid sloc>> <invalid sloc>
|-TypedefDecl 0x6bc3f40 <<invalid sloc>> <invalid sloc> implicit __int128_t '__int128'
|-TypedefDecl 0x6bc3fa0 <<invalid sloc>> <invalid sloc> implicit __uint128_t 'unsigned __int128'
|-TypedefDecl 0x6bc42f0 <<invalid sloc>> <invalid sloc> implicit __builtin_va_list '__va_list_tag [1]'
`-FunctionDecl 0x6bc4490 <min.c:1:1, line:6:1> line:1:5 min 'int (int, int)'|-ParmVarDecl 0x6bc4350 <col:9, col:13> col:13 used a 'int'|-ParmVarDecl 0x6bc43c0 <col:16, col:20> col:20 used b 'int'`-CompoundStmt 0x6bc46f8 <col:23, line:6:1>|-IfStmt 0x6bc4668 <line:2:5, line:4:5>| |-<<<NULL>>>| |-BinaryOperator 0x6bc45c0 <line:2:9, col:13> 'int' '<'| | |-ImplicitCastExpr 0x6bc4590 <col:9> 'int' <LValueToRValue>| | | `-DeclRefExpr 0x6bc4540 <col:9> 'int' lvalue ParmVar 0x6bc4350 'a' 'int'| | `-ImplicitCastExpr 0x6bc45a8 <col:13> 'int' <LValueToRValue>| |   `-DeclRefExpr 0x6bc4568 <col:13> 'int' lvalue ParmVar 0x6bc43c0 'b' 'int'| |-CompoundStmt 0x6bc4648 <col:16, line:4:5>| | `-ReturnStmt 0x6bc4628 <line:3:9, col:16>| |   `-ImplicitCastExpr 0x6bc4610 <col:16> 'int' <LValueToRValue>| |     `-DeclRefExpr 0x6bc45e8 <col:16> 'int' lvalue ParmVar 0x6bc4350 'a' 'int'| `-<<<NULL>>>`-ReturnStmt 0x6bc46d8 <line:5:5, col:12>`-ImplicitCastExpr 0x6bc46c0 <col:12> 'int' <LValueToRValue>`-DeclRefExpr 0x6bc4698 <col:12> 'int' lvalue ParmVar 0x6bc43c0 'b' 'int'

通過clang -### -fsyntax-only -Xclang -ast-dump min.c查看實際執行命令,其實跟使用clang -cc1是相同的。


參考資料:

1. 《Getting Started with LLVM Core Libraries》

2.? Code of clang



轉載于:https://www.cnblogs.com/ainima/p/6331913.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/376511.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/376511.shtml
英文地址,請注明出處:http://en.pswp.cn/news/376511.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Expression Trees 參數簡化查詢

ASP.NET MVC 引入了 ModelBinder 技術&#xff0c;讓我們可以在 Action 中以強類型參數的形式接收 Request 中的數據&#xff0c;極大的方便了我們的編程&#xff0c;提高了生產力。在查詢 Action 中&#xff0c;我們可以將 Expression Trees 用作參數&#xff0c;通過自定義的…

為你的程序添加監聽器

平時在寫程序時經常會遇到監聽器&#xff0c;比如按鈕的click監聽器&#xff0c;按鍵監聽器等等。而android中的監聽器和java中的回調函數是同一個概念&#xff0c;都是在底層代碼中定義一個接口來調用高層的代碼。那么什么是回調函數呢&#xff1f;網上說的是“在WINDOWS中&am…

圖像處理

android圖像處理系列之四&#xff0d;&#xff0d;給圖片添加邊框&#xff08;上&#xff09; http://www.oschina.net/question/157182_40586 android圖像處理系列之六&#xff0d;&#xff0d;給圖片添加邊框&#xff08;下&#xff09;&#xff0d;圖片疊加 http://www.osc…

Git push 時每次都需要密碼的疑惑

2015.1.13更新&#xff1a; 在本地搭建Git服務器時&#xff0c;也是有每次操作需要密碼的情況。 是因為每次做推送動作時&#xff0c;Git需要認證你是好人。所以需要密碼。 可以在 /home/username/.ssh/authorized_keys 文件里添加你的 ssh 公鑰。一行一個。這樣就可以在你push…

ruby字符串處理

1. str"abc123"puts str[0].chr > a puts str[0] >a的ascii碼 2.中文字符串的正則表達式 文本編碼:utf-8 文件第一行&#xff1a;#encoding:urf-8 require "iconv" str"八萬"reg/(.)萬/datareg.match(str)result Iconv.i…

PHP+七牛云存儲上傳圖片代碼片段

2014年11月14日 16:37:51 第一段代碼是上傳單個圖片的,第二個是上傳多個圖片的 1 //上傳到七牛2 //單個文件3 //formname: 表單名字; pre: 圖片Url中顯示的圖片名字(也就是七牛中的key)4 public function upImage($formname, $pre)5 {6 if (empty($_FI…

【PS】Gold words tutorials 赤金字教程

material_01material_021. White background and black words.The font of "Laker" is Teenick, and "Huang" is 中國龍粗魏碑2.Open material_01 and select a part of it.Copy and paste the part part into our workspace.You can drag and move to pa…

iOS 鍵盤的關閉

iOS 鍵盤的關閉 //通過委托來放棄 “第一響應者” #pragma mark - UITextField Delegate Method -(BOOL)textFieldShouldReturn:(UITextField*)textField {[textField resignFirstResponder];return YES; } //通過委托來放棄 “第一響應者” #pragma mark - UITextView Delegat…

遞歸與分治

今天總算把第三章遞歸與分治看完了&#xff0c;呵呵&#xff0c;沒想到開頭就給我來了點打擊&#xff0c;看以后不認真學還真不行了&#xff01; 為了祝賀初戰告捷&#xff0c;把幾個簡單的題目貼上來吧&#xff0c;紀念一下&#xff01; 《整數因子分解》 大于1的正整數n可以分…

Android中的Handler機制

直接在UI線程中開啟子線程來更新TextView顯示的內容&#xff0c;運行程序我們會發現&#xff0c;如下錯 誤&#xff1a;android.view.ViewRoot$CalledFromWrongThreadException: Only the original thread that created a view hierarchy can touch its views.翻譯過來就是&…

初來乍到

從今天開始&#xff0c;我也加入博客園這個大家庭了&#xff0c;希望能和大家一起學習IT技術&#xff0c;共同進步。小弟初來乍到&#xff0c;望大家能多多關照&#xff01;轉載于:https://www.cnblogs.com/markwave/p/3227777.html

JQuery學習四(過濾選擇器)

&#xff1a;first選擇第一個元素。$&#xff08;“div:first”&#xff09;進行選擇第一個<div> :last 選擇最后一個最后一個元素 $&#xff08;"div:last"&#xff09;選取最后一個<div> [:not(選擇器&#xff09;] 選擇不滿足“選擇器”條件的元素 $…

160 - 1 Acid burn

環境&#xff1a;Windows XP sp3 先打開&#xff0c;看看長什么樣&#xff1a; OD載入&#xff0c;右鍵->查找->所有參考文本字串 找到Sorry,The serial is incorect 找到后就在反匯編窗口跟隨&#xff0c;往上翻&#xff1a; 0042F998 /. 55 push ebp 0…

跟樹有關的數據結構學習系列之概覽

1.Binary Search Tree&#xff08;BST&#xff09; 二叉搜索樹 2.B-Tree 3.BTree 4.B*Tree轉載于:https://www.cnblogs.com/devindong/p/3233041.html

在社會實踐中長本領

暑假回到家&#xff0c;家里要我在自家店里幫忙&#xff0c;做員工。因為我家跟舅舅家合資開了一家家禽凍品批發部&#xff0c;生意興旺&#xff0c;越做越大&#xff0c;忙得不可開交。在自家店里做員工&#xff0c;當然&#xff0c;家里人都很高興&#xff0c;我也樂意。在員…

Animating Layout Changes(展開收起)

原文地址&#xff1a;https://developer.android.com/training/animation/layout.html#add &#xff08;1&#xff09;設置布局文件&#xff1a; <LinearLayout android:id"id/container"android:animateLayoutChanges"true"... /> &#xff08;2&am…

160 - 2 Afkayas.1

環境&#xff1a; Windows Xp sp3 OD載入&#xff1a; 運行&#xff0c;然后輸入&#xff1a; 然后回到OD&#xff0c;按F12來暫停&#xff0c; 然后ALTF9回到程序領空&#xff0c;把彈出的那個錯誤消息框點掉&#xff0c;這時OD來到這里&#xff1a; 004025F9 . 68 E81…

POJ 2125 Destroying The Graph (二分圖最小點權覆蓋集+輸出最小割方案)

題意 有一個圖&#xff0c; 兩種操作&#xff0c;一種是刪除某點的所有出邊&#xff0c;一種是刪除某點的所有入邊&#xff0c;各個點的不同操作分別有一個花費&#xff0c;現在我們想把這個圖的邊都刪除掉&#xff0c;需要的最小花費是多少。 思路 很明顯的二分圖最小點權覆蓋…

160 - 3 Afkayas.2

環境&#xff1a; Windows xp sp3 這次的目標有兩個&#xff1a; 1.去除Nag窗口 2.找出Serial的算法 1.這次去除Nag窗口用了另外兩個程序&#xff1a; &#xff08;1&#xff09;VBLocalize v1.1.0.0 &#xff08;2&#xff09;UltraEdit &#xff08;3&#xff09;VBEx…

class threading.Thread()說明:

class threading.Thread()說明&#xff1a; class threading.Thread(groupNone, targetNone, nameNone, args(), kwargs{}) This constructor should always be called with keyword arguments. Arguments are: group should be None; reserved for future extension when a Th…