談談iOS獲取調用鏈

本文由云+社區發表

iOS開發過程中難免會遇到卡頓等性能問題或者死鎖之類的問題,此時如果有調用堆棧將對解決問題很有幫助。那么在應用中如何來實時獲取函數的調用堆棧呢?本文參考了網上的一些博文,講述了使用mach thread的方式來獲取調用棧的步驟,其中會同步講述到棧幀的基本概念,并且通過對一個demo的匯編代碼的講解來方便理解獲取調用鏈的原理。

一、棧幀等幾個概念

先拋出一個棧幀的概念,解釋下什么是棧幀。

應用中新創建的每個線程都有專用的棧空間,棧可以在線程期間自由使用。而線程中有千千萬萬的函數調用,這些函數共享進程的這個棧空間,那么問題就來了,函數運行過程中會有非常多的入棧出棧的過程,當函數返回backtrace的時候怎樣能精確定位到返回地址呢?還有子函數所保存的一些寄存器的內容?這樣就有了棧幀的概念,即每個函數所使用的棧空間是一個棧幀,所有的棧幀就組成了這個線程完整的棧

img棧幀

下面再拋出幾個概念:

寄存器中的fp,sp,lr,pc

寄存器是和CPU聯系非常緊密的一小塊內存,經常用于存儲一些正在使用的數據。對于32位架構armv7指令集的ARM處理器有16個寄存器,從r0到r15,每一個都是32位比特。調用約定指定他們其中的一些寄存器有特殊的用途,例如:

  • r0-r3:用于存放傳遞給函數的參數;
  • r4-r11:用于存放函數的本地參數;
  • r11:通常用作楨指針fp(frame pointer寄存器),棧幀基址寄存器,指向當前函數棧幀的棧底,它提供了一種追溯程序的方式,來反向跟蹤調用的函數。
  • r12:是內部程序調用暫時寄存器。這個寄存器很特別是因為可以通過函數調用來改變它;
  • r13:棧指針sp(stack pointer)。在計算機科學內棧是非常重要的術語。寄存器存放了一個指向棧頂的指針。看這里了解更多關于棧的信息;
  • r14:是鏈接寄存器lr(link register)。它保存了當目前函數返回時下一個函數的地址;
  • r15:是程序計數器pc(program counter)。它存放了當前執行指令的地址。在每個指令執行完成后會自動增加;

不同指令集的寄存器數量可能會不同,pc、lr、sp、fp也可能使用其中不同的寄存器。后面我們先忽略r11等寄存器編號,直接用fp,sp,lr來講述

如下圖所示,不管是較早的幀,還是調用者的幀,還是當前幀,它們的結構是完全一樣的,因為每個幀都是基于一個函數,幀伴隨著函數的生命周期一起產生、發展和消亡。在這個過程中用到了上面說的寄存器,fp幀指針,它總是指向當前幀的底部;sp棧指針,它總是指向當前幀的頂部。這兩個寄存器用來定位當前幀中的所有空間。編譯器需要根據指令集的規則小心翼翼地調整這兩個寄存器的值,一旦出錯,參數傳遞、函數返回都可能出現問題。

其實這里這幾個寄存器會滿足一定規則,比如:

  • fp指向的是當面棧幀的底部,該地址存的值是調用當前棧幀的上一個棧幀的fp的地址。
  • lr總是在上一個棧幀(也就是調用當前棧幀的棧幀)的頂部,而棧幀之間是連續存儲的,所以lr也就是當前棧幀底部的上一個地址,以此類推就可以推出所有函數的調用順序。這里注意,棧底在高地址,棧向下增長

而由此我們可以進一步想到,通過sp和fp所指出的棧幀可以恢復出母函數的棧幀,不斷遞歸恢復便恢復除了調用堆棧。向下面代碼一樣,每次遞歸pc存儲的*(fp + 1)其實就是返回的地址,它在調用者的函數內,利用這個地址我們可以通過符號表還原出對應的方法名稱。

while(fp) {pc = *(fp + 1);fp = *fp;
}

二、匯編解釋下

如果你非要問為什么會這樣,我們可以從匯編角度看下函數是怎么調用的,從而更深刻理解為什么fp總是存儲了上一個棧幀的fp的地址,而fp向前一個地址為什么總是lr?

寫如下一個demo程序,由于我是在mac上做實驗,所以直接使用clang來編譯出可執行程序,然后再用hopper工具反匯編查看匯編代碼,當然也可直接使用clang的

-S參數指定生產匯編代碼。

demo源碼

#import <Foundation/Foundation.h>int func(int a);int main (void)
{int a = 1;func(a);return 0;
}int func (int a)
{int b = 2;return a + b;
}

匯編語言

        ; ================ B E G I N N I N G   O F   P R O C E D U R E ================; Variables:;    var_4: -4;    var_8: -8;    var_C: -12_main:
0000000100000f70         push       rbp
0000000100000f71         mov        rbp, rsp
0000000100000f74         sub        rsp, 0x10
0000000100000f78         mov        dword [rbp+var_4], 0x0
0000000100000f7f         mov        dword [rbp+var_8], 0x1
0000000100000f86         mov        edi, dword [rbp+var_8]                      ; argument #1 for method _func
0000000100000f89         call       _func
0000000100000f8e         xor        edi, edi
0000000100000f90         mov        dword [rbp+var_C], eax
0000000100000f93         mov        eax, edi
0000000100000f95         add        rsp, 0x10
0000000100000f99         pop        rbp
0000000100000f9a         ret; endp
0000000100000f9b         nop        dword [rax+rax]; ================ B E G I N N I N G   O F   P R O C E D U R E ================; Variables:;    var_4: -4;    var_8: -8_func:
0000000100000fa0         push       rbp                                         ; CODE XREF=_main+25
0000000100000fa1         mov        rbp, rsp
0000000100000fa4         mov        dword [rbp+var_4], edi
0000000100000fa7         mov        dword [rbp+var_8], 0x2
0000000100000fae         mov        edi, dword [rbp+var_4]
0000000100000fb1         add        edi, dword [rbp+var_8]
0000000100000fb4         mov        eax, edi
0000000100000fb6         pop        rbp
0000000100000fb7         ret

需要注意,由于是在mac上編譯出可執行程序,指令集已經是x86-64,所以上文的fp、sp、lr、pc名稱和使用的寄存器發生了變化,但含義基本一致,對應關系如下:

  • fp----rbp
  • sp----rsp
  • pc----rip

接下來我們看下具體的匯編代碼,可以看到在main函數中在經過預處理和參數初始化后,通過call _func來調用了func函數,這里call _func其實等價于兩個匯編命令:

Pushl %rip //保存下一條指令(第41行的代碼地址)的地址,用于函數返回繼續執行
Jmp _func //跳轉到函數foo

于是,當main函數調用了func函數后,會將下一行地址push進棧,至此,main函數的棧幀已經結束,然后跳轉到func的代碼處開始繼續執行。可以看出,rip指向的函數下一條地址,即上文中所說的lr已經入棧,在棧幀的頂部。

而從func的代碼可以看到,首先使用push rbp將幀指針保存起來,而由于剛跳轉到func函數,此時rbp其實是上一個棧幀的幀指針,即它的值其實還是上一個棧幀的底部地址,所以此步驟其實是將上一個幀底部地址保存了下來。

下一句匯編語句mov rbp, rsp將棧頂部地址rsp更新給了rbp,于是此時rbp的值就成了棧的頂部地址,也是當前棧幀的開始,即fp。而棧頂部又正好是剛剛push進去的存儲上一個幀指針地址的地址,所以rbp指向的時當前棧幀的底部,但其中保存的值是上一個棧幀底部的地址。

至此,也就解釋了為什么fp指向的地址存儲的內容是上一個棧幀的fp的地址,也解釋了為什么fp向前一個地址就正好是lr。

另外一個比較重要的東西就是出入棧的順序,在ARM指令系統中是地址遞減棧,入棧操作的參數入棧順序是從右到左依次入棧,而參數的出棧順序則是從左到右的你操作。包括push/pop和LDMFD/STMFD等。

三、獲取調用棧步驟

其實上面的幾個fp、lr、sp在mach內核提供的api中都有定義,我們可以使用對應的api拿到對應的值。如下便是64位和32位的定義

_STRUCT_ARM_THREAD_STATE64
{__uint64_t    __x[29];    /* General purpose registers x0-x28 */__uint64_t    __fp;        /* Frame pointer x29 */__uint64_t    __lr;        /* Link register x30 */__uint64_t    __sp;        /* Stack pointer x31 */__uint64_t    __pc;        /* Program counter */__uint32_t    __cpsr;    /* Current program status register */__uint32_t    __pad;    /* Same size for 32-bit or 64-bit clients */
};
_STRUCT_ARM_THREAD_STATE
{__uint32_t    r[13];    /* General purpose register r0-r12 */__uint32_t    sp;        /* Stack pointer r13 */__uint32_t    lr;        /* Link register r14 */__uint32_t    pc;        /* Program counter r15 */__uint32_t    cpsr;        /* Current program status register */
};

于是,我們只要拿到對應的fp和lr,然后遞歸去查找母函數的地址,最后將其符號化,即可還原出調用棧。

總結歸納了下,獲取調用棧需要下面幾步:

1、掛起線程

thread_suspend(main_thread);

2、獲取當前線程狀態上下文thread_get_state

_STRUCT_MCONTEXT ctx;#if defined(__x86_64__)mach_msg_type_number_t count = x86_THREAD_STATE64_COUNT;thread_get_state(thread, x86_THREAD_STATE64, (thread_state_t)&ctx.__ss, &count);#elif defined(__arm64__)_STRUCT_MCONTEXT ctx;mach_msg_type_number_t count = ARM_THREAD_STATE64_COUNT;thread_get_state(thread, ARM_THREAD_STATE64, (thread_state_t)&ctx.__ss, &count);#endif

3、獲取當前幀的幀指針fp

#if defined(__x86_64__)uint64_t pc = ctx.__ss.__rip;uint64_t sp = ctx.__ss.__rsp;uint64_t fp = ctx.__ss.__rbp;
#elif defined(__arm64__)uint64_t pc = ctx.__ss.__pc;uint64_t sp = ctx.__ss.__sp;uint64_t fp = ctx.__ss.__fp;
#endif

4、遞歸遍歷fp和lr,依次記錄lr的地址

while(fp) {pc = *(fp + 1);fp = *fp;
}

這一步我們其實就是使用上面的方法來依次迭代出調用鏈上的函數地址,代碼如下

void* t_fp[2];vm_size_t len = sizeof(record);
vm_read_overwrite(mach_task_self(), (vm_address_t)(fp),len, (vm_address_t)t_fp, &len);do {pc = (long)t_fp[1]  // lr總是在fp的上一個地址// 依次記錄pc的值,這里先只是打印出來printf(pc)vm_read_overwrite(mach_task_self(),(vm_address_t)m_cursor.fp[0], len, (vm_address_t)m_cursor.fp,&len);} while (fp);

上面代碼便會從下到上依次打印出調用棧函數中的地址,這個地址總是在函數調用地方的下一個地址,我們就需要拿這個地址還原出對應的符號名稱。

5、恢復線程thread_resume

thread_resume(main_thread);

6、還原符號表

這一步主要是將已經獲得的調用鏈上的地址分別解析出對應的符號。主要是參考了運行時獲取函數調用棧 的方法,其中用到的dyld鏈接mach-o文件的基礎知識,后續會專門針對這里總結一篇文章。

enumerateSegment(header, [&](struct load_command *command) {if (command->cmd == LC_SYMTAB) {struct symtab_command *symCmd = (struct symtab_command *)command;uint64_t baseaddr = 0;enumerateSegment(header, [&](struct load_command *command) {if (command->cmd == LC_SEGMENT_64) {struct segment_command_64 *segCmd = (struct segment_command_64 *)command;if (strcmp(segCmd->segname, SEG_LINKEDIT) == 0) {baseaddr = segCmd->vmaddr - segCmd->fileoff;return true;}}return false;});if (baseaddr == 0) return false;nlist_64 *nlist = (nlist_64 *)(baseaddr + slide + symCmd->symoff);uint64_t strTable = baseaddr + slide + symCmd->stroff;uint64_t offset = UINT64_MAX;int best = -1;for (int k = 0; k < symCmd->nsyms; k++) {nlist_64 &sym = nlist[k];uint64_t d = pcSlide - sym.n_value;if (offset >= d) {offset = d;best = k;}}if (best >= 0) {nlist_64 &sym = nlist[best];std::cout << "SYMBOL: " << (char *)(strTable + sym.n_un.n_strx) << std::endl;}return true;}return false;
});

參考

函數調用棧空間以及fp寄存器

函數調用棧

也談棧和棧幀

運行時獲取函數調用棧

深入解析Mac OS X & iOS 操作系統 學習筆記

此文已由作者授權騰訊云+社區在各渠道發布

獲取更多新鮮技術干貨,可以關注我們騰訊云技術社區-云加社區官方號及知乎機構號

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/388497.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/388497.shtml
英文地址,請注明出處:http://en.pswp.cn/news/388497.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python 移動平均線_Python中的移動平均線

python 移動平均線There are situations, particularly when dealing with real-time data, when a conventional average is of little use because it includes old values which are no longer relevant and merely give a misleading impression of the current situation.…

Ireport制作過程

Ireport制作過程 1、首先要到Option下設置一下ClassPath添加文件夾 2、到預覽->報表字段設置一下將要用到的字段 3、到編輯->查詢報表->寫sql語句&#xff0c;然后把語句查詢的字段結果與上面設置的報表字段的名要對應上 4、Option->選項->Compiler設置一下…

2018.09.16 loj#10243. 移棋子游戲(博弈論)

傳送門 題目中已經給好了sg圖&#xff0c;直接在上面跑出sg函數即可。 最后看給定點的sg值異或和是否等于0就判好了。 代碼&#xff1a; #include<bits/stdc.h> #define N 2005 #define M 6005 using namespace std; int n,m,k,sg[N],first[N],First[N],du[N],cnt0,an…

html5字體的格式轉換,font字體

路由器之家網今天精心準備的是《font字體》&#xff0c;下面是詳解&#xff01;html中的標簽是什么意思HTML提供了文本樣式標記&#xff0c;用來控制網頁中文本的字體、字號和顏色&#xff0c;多種多樣的文字效果可以使網頁變得更加絢麗。其基本語法格式&#xff1a;文本內容fa…

紅星美凱龍牽手新潮傳媒搶奪社區消費市場

瞄準線下流量紅利&#xff0c;紅星美凱龍牽手新潮傳媒搶奪社區消費市場 中新網1月14日電 2019年1月13日&#xff0c;紅星美凱龍和新潮傳媒戰略合作發布會在北京召開&#xff0c;雙方宣布建立全面的戰略合作伙伴關系。未來&#xff0c;新潮傳媒的梯媒產品將入駐紅星美凱龍的全國…

機器學習 啤酒數據集_啤酒數據集上的神經網絡

機器學習 啤酒數據集Artificial neural networks (ANNs), usually simply called neural networks (NNs), are computing systems vaguely inspired by the biological neural networks that constitute animal brains.人工神經網絡(ANN)通常簡稱為神經網絡(NNs)&#xff0c;是…

實例演示oracle注入獲取cmdshell的全過程

以下的演示都是在web上的sql plus執行的&#xff0c;在web注入時 把select SYS.DBMS_EXPORT_EXTENSION.....改成   /xxx.jsp?id1 and 1<>a||(select SYS.DBMS_EXPORT_EXTENSION.....)   的形式即可。(用" a|| "是為了讓語句返回true值)   語句有點長…

html視頻位置控制器,html5中返回音視頻的當前媒體控制器的屬性controller

實例檢測該視頻是否有媒體控制器&#xff1a;myViddocument.getElementById("video1");alert("Controller: " myVid.controller);定義和用法controller 屬性返回音視頻的當前媒體控制器。默認地&#xff0c;音視頻元素不會有媒體控制器。如果規定了媒體控…

ER TO SQL語句

ER TO SQL語句的轉換&#xff0c;在數據庫設計生命周期的位置如下所示。 一、轉換的類別 從ER圖轉化得到關系數據庫中的SQL表&#xff0c;一般可分為3類&#xff1a; 1&#xff09;轉化得到的SQL表與原始實體包含相同信息內容。該類轉化一般適用于&#xff1a; 二元“多對多”關…

dede 5.7 任意用戶重置密碼前臺

返回了重置的鏈接&#xff0c;還要把&amp刪除了&#xff0c;就可以重置密碼了 結果只能改test的密碼&#xff0c;進去過后&#xff0c;這個居然是admin的密碼&#xff0c;有點頭大&#xff0c;感覺這樣就沒有意思了 我是直接上傳的一句話&#xff0c;用菜刀連才有樂趣 OK了…

nasa數據庫cm1數據集_獲取下一個地理項目的NASA數據

nasa數據庫cm1數據集NASA provides an extensive library of data points that they’ve captured over the years from their satellites. These datasets include temperature, precipitation and more. NASA hosts this data on a website where you can search and grab in…

注入代碼oracle

--建立類 select SYS.DBMS_EXPORT_EXTENSION.GET_DOMAIN_INDEX_TABLES(FOO,BAR,DBMS_OUTPUT".PUT(:P1);EXECUTE IMMEDIATE DECLARE PRAGMA AUTONOMOUS_TRANSACTION;BEGIN EXECUTE IMMEDIATE  create or replace and compile java source named "LinxUtil" as …

html5包含inc文件,HTML中include file標簽的用法

參數PathType將 FileName 的路徑類型。路徑可為以下某種類型&#xff1a;路徑類型 含義文件 該文件名是帶有 #include 命令的文檔所在目錄的相對路徑。被包含文件可位于相同目錄或子目錄中&#xff1b;但它不能處于帶有 #include 命令的頁的上層目錄中。虛擬 文件名為 Web 站點…

r語言處理數據集編碼_在強調編碼語言或工具之前,請學習這3個基本數據概念

r語言處理數據集編碼重點 (Top highlight)I got an Instagram DM the other day that really got me thinking. This person explained that they were a data analyst by trade, and had years of experience. But, they also said that they felt that their technical skill…

springboot微服務 java b2b2c電子商務系統(一)服務的注冊與發現(Eureka)

一、spring cloud簡介spring cloud 為開發人員提供了快速構建分布式系統的一些工具&#xff0c;包括配置管理、服務發現、斷路器、路由、微代理、事件總線、全局鎖、決策競選、分布式會話等等。它運行環境簡單&#xff0c;可以在開發人員的電腦上跑。Spring Cloud大型企業分布式…

linux部署服務器常用命令

fdisk -l 查分區硬盤 df -h 查空間硬盤 cd / 進目錄 ls/ll 文件列表 vi tt.txt iinsert 插入 shift: 進命令行 wq 保存%退出 cat tt.txt 內容查看 pwd 當期目錄信息 mkdir tt建目錄 cp tt.txt tt/11.txt 拷貝文件到tt下 mv 11.txt /usr/ 移動 rm -rf tt.txt 刪除不提示 rm t…

HTML和CSS面試問題總結,html和css面試總結

html和cssw3c 規范結構化標準語言樣式標準語言行為標準語言1) 盒模型常見的盒模型有w3c盒模型(又名標準盒模型)box-sizing:content-box和IE盒模型(又名怪異盒模型)box-sizing:border-box。標準盒子模型&#xff1a;寬度內容的寬度(content) border padding margin低版本IE盒子…

css清除浮動float的七種常用方法總結和兼容性處理

在清除浮動前我們要了解兩個重要的定義&#xff1a; 浮動的定義&#xff1a;使元素脫離文檔流&#xff0c;按照指定方向發生移動&#xff0c;遇到父級邊界或者相鄰的浮動元素停了下來。 高度塌陷&#xff1a;浮動元素父元素高度自適應&#xff08;父元素不寫高度時&#xff0c;…

數據遷移測試_自動化數據遷移測試

數據遷移測試Data migrations are notoriously difficult to test. They take a long time to run on large datasets. They often involve heavy, inflexible database engines. And they’re only meant to run once, so people think it’s throw-away code, and therefore …

使用while和FOR循環分布打印字符串S='asdfer' 中的每一個元素

方法1&#xff1a; s asdfer for i in s :print(i)方法2:index 0 while 1:print(s[index])index1if index len(s):break 轉載于:https://www.cnblogs.com/yuhoucaihong/p/10275800.html