winshark重要數據結構

說起來有一些慚愧,研究wireshark有一段時間了,但是對源代碼的分析卻至今沒有什么進展。。。

最初想要研究wireshark是因為我的開題是基于wireshark來做的。

現在有很多抓包工具,wireshark的優勢在于完全開源,分析功能強大,但其缺點也很明顯,即捕獲的數據包存儲過于分散,大數據背景下,不能有效的對海量的數據包進行存儲分析,因此將wireshark捕獲到的數據存儲到專門的數據庫中是非常必要的。(當然,存儲數據只是第一步,接下來還要進行對數據的分析工作)

真正開始分析wireshark了,首先是編譯。unbutu下很順利就編譯通過了,但是在windows下卻出現各種問題,至今沒有編譯通過。。。,分析wireshark源代碼,在windows下編譯通過有必要嗎?

后來看關于wireshark的論文,接觸到了兩個東西。即winpcap、libpcap

winpcap是底層的,在windows上wireshark是依賴于winpcap來截包的,在linux上則是依賴于libpcap。而winpcap又是基于libpcap的設計基礎上開發設計的,使用方法也和libpcap基本相同。

那么,我在分析wireshark存儲部分源代碼的時候有必要看winpcap和libpcap的函數庫嗎?

到真正看wireshark源代碼了,200多M,算上子文件共2000多個,對于一個不是計算機科班出身的我來說,不得不說,有點困難。。 從百度文庫上下載了些資料,主要是分析wireshark邏輯功能模塊,最有價值的應該是這篇了,如下:

a)  GTK1/2
處理用戶的輸入輸出顯示,源碼在gtk目錄.b)  Core
核心模塊,通過函數調用將其他模塊連接在一起,源碼在根目錄c)  Epan
wireshark Packetage Analyzing,包分析引擎,源碼在epan目錄Protocol-Tree:保存數據包的協議信息,wireshark的協議結構采用樹形結構,解析協議報文時只需要從根節點通過函數句柄依次調用各層解析函數即可。Dissectors:在epan/dissector目錄下,各種協議解碼器,支持700+種協議解析,對于每種協議,解碼器都能識別出協議字段(field),并顯示出字段值(field value)由于網絡協議種類很多,為了使協議和協議間層次關系明顯,對數據流里的各個層次的協議能夠逐層處理,wireshark系統采用了協議樹的方式。Plugins:一些協議解碼器以插件形式實現,源碼在plugins目錄Display-Filters:顯示過濾引擎,源碼在epan/dfilter目錄d)  Capture
捕包引擎,利用libpcap/WinPcap從底層抓取網絡數據包,libpcap/WinPcap提供了通用的抓包接口,能從不同類型的網絡接口(包括以太網,令牌環網,ATM網等)獲取數據包。e)  Wiretap
從文件中讀取數據包,支持多種文件格式,源碼在wiretap目錄f)  Win-/libpcap
Wireshark抓包時依賴的庫文件wireshark功能模塊3.  wireshark流程分析
1)  初始化
Wireshark的初始化包括一些全局變量的初始化、協議分析引擎的初始化和Gtk相關初始化,顯示Ethereal主窗口,等待用戶進一步操作。重點就是Epan模塊的初始化。
Epan初始化:tvbuff初始化:全局變量tvbuff_mem_chunk指向用memchunk分配的固定大小的空閑內存塊,每個內存塊是tvbuff_t結構,從空閑內存塊中取出后,用來保存原始數據包。協議初始化:全局變量:proto_names proto_short_names proto_filter_names 
以上三個全局變量主要用來判斷新注冊的協議名是否重復,如果重復,給出提示信息,在協議解析過程中并沒有使用。
?   協議注冊:
?   注冊協議:將三個參數分別注冊給proto_names、proto_short_names、proto_filter_names三個全局變量中,
?   注冊字段,需要在wireshark協議樹顯示的報文內容字段。
?   協議解析表
?   Handoff注冊
?   將協議與父協議節點關聯起來
?   Packet(包)初始化
?   全局變量:
?   frame_handle:協議解析從frame開始,層層解析,直到所有的協議都解析完為止。frame_handle保存了frame協議的handle。
?   data_handle:有的協議無法從frame開始,那么就從data開始。原理同frame。 
?   讀配置文件preference
?   讀capture filter和display filter文件,分別保存在全局變量capture_filter和display_filter中。
?   讀disabled protocols文件,保存全局變量global_disabled_protos和disabled_protos中
?   初始化全局變量cfile
?   Cfile是個重要的變量,數據類型為capture file,它保存了數據包的所有信息,
?   取得命令行啟動時,參數列表,并進行相應的處理2)  處理流程
Wireshark初始化完成以后進入實際處理階段,主程序創建抓包進程,捕包進程和主程序是通過PIPE進行傳遞數據的,主程序把抓取的數據寫入臨時文件,通過函數add_packet_to_packet_list將數據包加入包列表。處理時,主程序從列表中選取一個數據包,提取該數據包中的數據填寫在數據結構中,最后調用協議解析函數epan_dissect_run進行處理,從epan_dissect_run開始,是實際的協議解析過程,
下面以HTTP協議報文為例,流程如下:
a)  解析frame層
調用函數dissect_frame對frame層進行解析,并在協議樹上填充相應字段信息。函數最后會判斷是否有上層協議封裝,如果有則調用函數dissector_try_port在協議樹上查找對應的解析函數,這里函數dissector_try_port根據pinfo->fd->lnk_t查找對應的上層協議處理函數,pinfo->fd->lnk_t值為1,上層封裝協議為以太網協議,全局結構體指針變量dissector_handle當前的協議解析引擎句柄置為dissect_eth_maybefcs,至此,frame層解析結束。
b)  解析以太網層
函數call_dissector_work根據dissector_handle調用frame上層協議解析函數dissect_eth_maybefcs對以太網層進行解析,并在協議樹上填充相應字段,包括目的MAC地址和以太網上層協議類型等信息。函數最后會判斷是否有上層協議封裝,如果有則調用函數dissector_try_port在協議樹上查找對應的解析函數,這里函數dissector_try_port根據etype查找對應的上層協議處理函數,以太網字段etype為0800的報文是ip報文,上層封裝協議為IP協議,全局結構體指針變量dissector_handle當前的協議解析引擎句柄置為dissect_ip,至此,以太網層解析結束。
c)  解析IP層
函數call_dissector_work根據dissector_handle調用以太網上層協議解析函數dissect_ip對以太網層進行解析,并在協議樹上填充相應字段,包括版本號,源地址,目的地址等信息。函數最后會判斷是否有上層協議封裝,如果有則調用函數dissector_try_port在協議樹上查找對應的解析函數,這里函數dissector_try_port根據nxt (nxt = iph->ip_p)查找對應的上層協議處理函數,以太網字段nxt為06的報文是TCP報文,上層封裝協議為TCP協議,全局結構體指針變量dissector_handle當前的協議解析引擎句柄置為dissect_tcp,至此,IP層解析結束。
d)  解析TCP層
函數call_dissector_work根據dissector_handle調用以太網上層協議解析函數dissect_tcp對TCP層進行解析,包括對TCP頭的解析和選項字段的解析,并在協議樹上填充相應字段,包括源端口,目的端口,標志位等信息。函數最后會判斷是否有上層協議封裝,如果有則調用函數dissector_try_port在協議樹上查找對應的解析函數,這里函數dissector_try_port根據port查找對應的上層協議處理函數,將源端口和目的端口分別賦值給low_port和high_port,根據low_port和high_port分別匹配上層協議解析函數,port為80的報文是HTTP報文,上層封裝協議為HTTP協議,全局結構體指針變量dissector_handle當前的協議解析引擎句柄置為dissect_http,至此,TCP層解析結束。
e)  解析HTTP層
至此wireshark進入應用層協議檢測階段,wireshark解析dissect_http函數中注冊的字段,并提取相應的字段值添加到協議樹中,應用層的具體解析流程將在下面介紹。HTTP協議具體函數調用過程參見: 重要的數據結構struct _epan_dissect_t {tvbuff_t    *tvb;//用來保存原始數據包proto_tree  *tree;//協議樹結構packet_info pi;// 包括各種關于數據包和協議顯示的相關信息
};/** Each proto_tree, proto_item is one of these. */
typedef struct _proto_node {struct _proto_node *first_child;//協議樹節點的第一個子節點指針struct _proto_node *last_child; //協議樹節點的最后一個子節點指針struct _proto_node *next; //協議樹節點的下一個節點指針struct _proto_node *parent;//父節點指針field_info  *finfo;//保存當前協議要顯示的地段tree_data_t *tree_data;//協議樹信息
} proto_node;typedef struct _packet_info {const char *current_proto;    //當前正在解析的協議名稱column_info *cinfo;       //wireshark顯示的信息frame_data *fd;//現在分析的原始數據指針union wtap_pseudo_header *pseudo_header;//frame類型信息GSList *data_src;     /*frame層信息 */address dl_src;       /* 源MAC */address dl_dst;       /*目的MAC */address net_src;      /* 源IP */address net_dst;      /*目的IP */address src;          /*源IP */address dst;          /*目的IP */guint32 ethertype;        /*以太網類型字段*/guint32 ipproto;      /* IP協議類型*/guint32 ipxptype;     /* IPX 包類型 */guint32 mpls_label;       /* MPLS包標簽*/circuit_type ctype;       guint32 circuit_id;       /*環路ID */const char *noreassembly_reason;  /* 重組失敗原因*/gboolean fragmented;      /*為真表示未分片*/gboolean in_error_pkt;    /*錯誤包標志*/port_type ptype;      /*端口類型 */guint32 srcport;      /*源端口*/guint32 destport;     /*目的端口*/guint32 match_port;           /*進行解析函數匹配時的匹配端口*/const char *match_string; /*調用子解析引擎時匹配的協議字段指針*/guint16 can_desegment;    /* 能否分段標志*/guint16 saved_can_desegment;  int desegment_offset;     /*分段大小*/
#define DESEGMENT_ONE_MORE_SEGMENT 0x0fffffff
#define DESEGMENT_UNTIL_FIN        0x0ffffffeguint32 desegment_len;    guint16 want_pdu_tracking;    guint32 bytes_until_next_pdu;int     iplen;                /*IP包總長*/int     iphdrlen;             /*IP頭長度*/int     p2p_dir;              guint16 oxid;                 /* next 2 fields reqd to identify fibre */guint16 rxid;                 /* channel conversations */guint8  r_ctl;                /* R_CTL field in Fibre Channel Protocol */guint8  sof_eof;             guint16 src_idx;              /* Source port index (Cisco MDS-specific) */guint16 dst_idx;              /* Dest port index (Cisco MDS-specific) */guint16 vsan;                 /* Fibre channel/Cisco MDS-specific *//* Extra data for DCERPC handling and tracking of context ids */guint16 dcectxid;             /* Context ID (DCERPC-specific) */int     dcetransporttype;guint16 dcetransportsalt; /* fid: if transporttype==DCE_CN_TRANSPORT_SMBPIPE */
#define DECRYPT_GSSAPI_NORMAL   1
#define DECRYPT_GSSAPI_DCE  2guint16 decrypt_gssapi_tvb;tvbuff_t *gssapi_wrap_tvb;tvbuff_t *gssapi_encrypted_tvb;tvbuff_t *gssapi_decrypted_tvb;gboolean gssapi_data_encrypted;guint32 ppid;  /* SCTP PPI of current DATA chunk */guint32 ppids[MAX_NUMBER_OF_PPIDS]; /* The first NUMBER_OF_PPIDS PPIDS which are present * in the SCTP packet*/void    *private_data;    /* pointer to data passed from one dissector to another *//* TODO: Use emem_strbuf_t instead */GString *layer_names;     /* layers of each protocol */guint16 link_number;guint8  annex_a_used;guint16 profinet_type;    /* the type of PROFINET packet (0: not a PROFINET packet) */void *profinet_conv;     /* the PROFINET conversation data (NULL: not a PROFINET packet) */void *usb_conv_info;void *tcp_tree;       /* proto_tree for the tcp layer */const char *dcerpc_procedure_name;    /* Used by PIDL to store the name of the current dcerpc procedure */struct _sccp_msg_info_t* sccp_info;guint16 clnp_srcref;      /* clnp/cotp source reference (can't use srcport, this would confuse tpkt) */guint16 clnp_dstref;      /* clnp/cotp destination reference (can't use dstport, this would confuse tpkt) */guint16 zbee_cluster_id;  /* ZigBee cluster ID, an application-specific message identifier that* happens to be included in the transport (APS) layer header.*/guint8 zbee_stack_vers;     int link_dir; /* 3GPP messages are sometime different UP link(UL) or Downlink(DL)*/
} packet_info;

因為我的主要工作是修改wireshark存儲部分源代碼,還有必要從main開始分析嗎?看到一層層的調用,要調暈了。。。。

博客寫的有點亂了,總之,不知道如何開始。。。。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/385055.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/385055.shtml
英文地址,請注明出處:http://en.pswp.cn/news/385055.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

C語言寫數據庫(二)

簡單的實現增刪查改的操作后,實現了一個先讀寫其中一個表的某兩項內容,再把相關字符段寫入到另外一張表中去。涉及到查詢和插入兩個步驟。 其中還涉及到漢字的讀寫和插入,會有字符的操作產生亂碼。所以要先保證mysql的漢字字符編碼&#xff0…

wireshark源代碼分析

各位親,不是我不想回復你們的問題。是我也不了解。不能誤導。希望大家相互幫助。看看能否幫那些提問的小盆友們回復一下呢? 這些都是轉載的,如果實在沒有辦法,可以打開鏈接到原作者哪里去提問試試看。。。 經過多次嘗試&#xf…

C語言寫數據庫(三)

遇到的問題以及解決思路方法 1.外部導入數據庫文件 進入mysql,創建數據庫sh_robot source /home/exbot/sh_robot.sql 查看數據庫編碼格式 show variables like “%char%”; 2.數據庫插入操作 進入相關數據庫:use 數據庫名; 查詢存在該表是否存…

Makefile(一)

在一個文件夾中建一個c文件 //main.c #include<stdio.h> int main() {printf("version 1.0");return 0; } 在當前目錄下編寫makefile文件 //makefile: test : main.o //一種依賴關系聲明&#xff0c;生成test可執行程序需要以來main.o文件gcc -o test main.…

Defunct進程 僵尸進程

在測試基于 DirectFBGstreamer 的視頻聯播系統的一個 Demo 的時候&#xff0c;其中大量使用 system 調用的語句&#xff0c;例如在 menu 代碼中的 system("./play") &#xff0c;而且多次執行&#xff0c;這種情況下&#xff0c;在 ps -ef 列表中出現了大量的 defunc…

make文件基礎用法

參照&#xff1a;https://www.jianshu.com/p/0b2a7cb9a469 創建工作目錄&#xff0c;包含一下文件 main.cperson.cb.hc.h/*** c.h ***/ //this is c.h /*** b.h ***/ //this is b.h /*** main.c ***/ #include<stdio.h> //#include"a1.h" //#include"b.h&…

一個Linux下C線程池的實現(轉)

1.線程池基本原理 在傳統服務器結構中, 常是 有一個總的 監聽線程監聽有沒有新的用戶連接服務器, 每當有一個新的 用戶進入, 服務器就開啟一個新的線程用戶處理這 個用戶的數據包。這個線程只服務于這個用戶 , 當 用戶與服務器端關閉連接以后, 服務器端銷毀這個線程。然而頻繁地…

二維數組作為函數參數

#include<stdio.h> //#include<> //二位數組作為函數參數時&#xff0c;可以不指定第一個下標 void print_buf(int (*p)[3],int a,int b) //void print_buf(int p[][3],int a,int b) {int i,j;for(i 0 ; i < a; i){for(j 0; j < b; j){printf("p[%…

mystrcat

#include<stdio.h> //如果一個數組做為函數的形參傳遞&#xff0c;那么數組可以在被調用的函數中修改 //有時候不希望這個事發生&#xff0c;所以對形參采用const參數 //size_t strlen(const char *s); //strcpy(char* s1,const char* s2); void mystrcat(char *s1,cons…

關于非阻塞的recv的時候返回的處理

注意recv&#xff08;&#xff09;如果讀到數據為0&#xff0c;那么就表示文件結束了&#xff0c;如果在讀的過程中遇到了中斷那么會返回-1&#xff0c;同時置errno為EINTR。 因此判斷recv的條件&#xff1a; 如果read返回<0 如果0 表示文件結束&…

帶參程序

windows環境 #include<stdio.h>int main(int argc, char *argv[]) {printf("argc %d\n", argc);for (int i 0; i < argc; i){printf("argv[%d] %s\n",i, argv[i]);}system("pause");return 0; } windows環境下&#xff0c;帶參函數…

Ubuntu安裝mysql步驟

1.打開終端&#xff0c;輸入&#xff1a; sudo apt-get updata 輸入root用戶密碼 2.更新完畢后&#xff0c;輸入 sudo apt-get install mysql-server ubuntu14.04安裝中間會讓你設置密碼&#xff0c;輸入密碼后點擊確認(mysql123) 3.安裝結束后&#xff0c;查看端口號是否開啟 …

Pthread創建線程后必須使用join或detach釋放線程資源

這兩天在看Pthread 資料的時候&#xff0c;無意中看到這樣一句話(man pthread_detach): Either pthread_join(3) or pthread_detach() should be called for each thread that an application creates, so that system resources for the thread can be released. …

二維數組求平均值(指針的使用)

#include<stdio.h>int main() {int buf[3][5] {{1,2,3,4,5},{4,5,6,7,8},{7,8,9,10,11}};int i;int j;//求行平均值 for(i 0; i < 3; i){int sum 0;for(j 0; j < 5; j){sum (*(*(buf i) j));}printf("sum %d\n",sum/5);}//求列平均值for(i 0; i …

linux終端關閉時為什么會導致在其上啟動的進程退出?

現象 經常在linux下開發的人應該都有這樣的經驗&#xff0c;就是在終端上啟動的程序&#xff0c;在關閉終端時&#xff0c;這個程序的進程也被一起關閉了。看下面這個程序&#xff0c;為了使進程永遠運行&#xff0c;在輸出helloworld后&#xff0c;循環調用sleep&#xff1a; …

二維數組做函數參數傳遞

#include<stdio.h> //#include<> //二位數組作為函數參數時&#xff0c;可以不指定第一個下標 void print_buf(int (*p)[3],int a,int b) //void print_buf(int p[][3],int a,int b) {int i,j;for(i 0 ; i < a; i){for(j 0; j < b; j){printf("p[%…

libevent源碼深度剖析

第一章 1&#xff0c;前言 Libevent是一個輕量級的開源高性能網絡庫&#xff0c;使用者眾多&#xff0c;研究者更甚&#xff0c;相關文章也不少。寫這一系列文章的用意在于&#xff0c;一則分享心得&#xff1b;二則對libevent代碼和設計思想做系統的、更深層次的分析&#xff…

函數返回指針類型(strchr函數)

#include<stdio.h> #include<string.h> char *mystrchr(char *s,char c) {while(*s){if(*s c){return s;}s;}return NULL; }int main() {char str[100] "hello world";//char* s strchr(str,a);char *s mystrchr(str,e);//返回ello world字符串 prin…

函數與指針

#include<stdio.h>int add(int a,int b) {return ab; }int main() {void *p(int,char *); //聲明了一個函數 &#xff0c;函數名為p&#xff0c;函數返回值為void*,函數的 void (*p)(int,char *);//定義了一個指向參數為int和char*返回值為void的函數指針//定義一個參數為…

使用指針在函數中交換數值

#include<stdio.h>void swap(int* a,int *b) {/*int temp *a;*a * b;*b temp;*/*a *b;*b *a - *b;*a *a - *b; }int main() {int a 10;int b 20;swap(&a,&b);printf("a %d,b %d\n",a,b);} 轉載于:https://www.cnblogs.com/wanghao-boke/p/1…