系統調用dup和dup2能夠復制文件描述符。dup返回新的文件文件描述符(沒有用的文件描述符最小的編號)。dup2可以讓用戶指定返回的文件描述符的值,如果需要,則首先接近newfd的值,他通常用來重新打開或者重定向一個文件描述符。
他的原型如下:
#include <unsitd.h>
int dup(int oldfd);
int dup2(int oldfd,int newfd);
dup 和dup2都是返回新的描述符。或者返回-1并設置 errno變量。新老描述符共享文件的偏移量(位置)、標志和鎖,但是不共享close-on-exec標志。
?
相信大部分在Unix/Linux下編程的程序員手頭上都有《Unix環境高級編程》(APUE)這本超級經典巨著。作者在該書中講解dup/dup2之前曾經講過“文件共享”,這對理解dup/dup2還是很有幫助的。這里做簡單摘錄以備在后面的分析中使用:
Stevens said:
(1) 每個進程在進程表中都有一個記錄項,每個記錄項中有一張打開文件描述符表,可將視為一個矢量,每個描述符占用一項。與每個文件描述符相關聯的是:
?
?
(2) 內核為所有打開文件維持一張文件表。每個文件表項包含:
?
?
?
圖示:
?
?
fd0 0?
?
fd1 1?
?
fd2 2?
?
fd3 3?
?
... ...
... ...
?
一、單個進程內的dup和dup2
假設進程A擁有一個已打開的文件描述符fd3,它的狀態如下
進程A的文件描述符表(before dup2)
?
fd0 0?
?
fd1 1?
?
fd2 2?
?
fd3 3?
?
... ...
... ...
?
經下面調用:
n_fd = dup2(fd3, STDOUT_FILENO);后進程狀態如下:
進程A的文件描述符表(after dup2)
?
fd0 0?
?
n_fd 1?
?
fd2 2?
?
fd3 3?
?
... ...
... ...
?
解釋如下:
n_fd = dup2(fd3, STDOUT_FILENO)表示n_fd與fd3共享一個文件表項(它們的文件表指針指向同一個文件表項),n_fd在文件描述符表中的位置為 STDOUT_FILENO的位置,而原先的STDOUT_FILENO所指向的文件表項被關閉,我覺得上圖應該很清晰的反映出這點。按照上面的解釋我們就可以解釋CU中提出的一些問題:
(1) "dup2的第一個參數是不是必須為已打開的合法filedes?" -- 答案:必須。
(2) "dup2的第二個參數可以是任意合法范圍的filedes值么?" -- 答案:可以,在Unix其取值區間為[0,255]。
另外感覺理解dup2的一個好方法就是把fd看成一個結構體類型,就如上面圖形中畫的那樣,我們不妨把之定義為:
struct fd_t {
int index;
filelistitem *ptr;
};
然后dup2匹配index,修改ptr,完成dup2操作。
在學習dup2時總是碰到“重定向”一詞,上圖完成的就是一個“從標準輸出到文件的重定向”,經過dup2后進程A的任何目標為STDOUT_FILENO的I/O操作如printf等,其數據都將流入fd3所對應的文件中。下面是一個例子程序:
#define TESTSTR "Hello dup2\n"
int main() {
?
?
?
?
?
?
?
?
?
?
?
}
其結果就是你在testdup2.dat中看到"Hello dup2"。
二、重定向后恢復
CU上有這樣一個帖子,就是如何在重定向后再恢復原來的狀態?首先大家都能想到要保存重定向前的文件描述符。那么如何來保存呢,象下面這樣行么?
int s_fd = STDOUT_FILENO;
int n_fd = dup2(fd3, STDOUT_FILENO);
還是這樣可以呢?
int s_fd = dup(STDOUT_FILENO);
int n_fd = dup2(fd3, STDOUT_FILENO);
這兩種方法的區別到底在哪呢?答案是第二種方案才是正確的,分析如下:按照第一種方法,我們僅僅在"表面上"保存了相當于fd_t(按照我前面說的理解方法)中的index,而在調用dup2之后,ptr所指向的文件表項由于計數值已為零而被關閉了,我們如果再調用dup2(s_fd, fd3)就會出錯(出錯原因上面有解釋)。而第二種方法我們首先做一下復制,復制后的狀態如下圖所示:
進程A的文件描述符表(after dup)
?
fd0 0?
?
fd1 1?
?
fd2 2?
?
fd3 3?
?
s_fd 4?
?
... ...
... ...
?
調用dup2后狀態為:
進程A的文件描述符表(after dup2)
?
fd0 0?
?
n_fd 1?
?
fd2 2?
?
fd3 3?
?
s_fd 4?
?
... ...
... ...
?
dup(fd)的語意是返回的新的文件描述符與fd共享一個文件表項。就如after dup圖中的s_fd和fd1共享文件表1一樣。
確定第二個方案后重定向后的恢復就很容易了,只需調用dup2(s_fd, n_fd);即可。下面是一個完整的例子程序:
#define TESTSTR "Hello dup2\n"
#define SIZEOFTESTSTR 11
int main() {
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
}
注 意這里我在輸出數據的時候我是用了不帶緩沖的write庫函數,如果使用帶緩沖區的printf,則最終結果為屏幕上輸出兩行"Hello dup2",而文件testdup2.dat中為空,原因就是緩沖區作怪,由于最終的目標是屏幕,所以程序最后將緩沖區的內容都輸出到屏幕。
三、父子進程間的dup/dup2
由fork調用得到的子進程和父進程的相同文件描述符共享同一文件表項,如下圖所示:
父進程A的文件描述符表
?
fd0 0?
?
fd1 1?
?
fd2 2?
?
?
子進程B的文件描述符表?
?
fd0 0?
?
fd1 1?
?
fd2 2?
?
所以恰當的利用dup2和dup可以在父子進程之間建立一條“溝通的橋梁”。這里不詳述。
四、小結
靈活的利用dup/dup2可以給你帶來很多強大的功能,花了一些時間總結出上面那么多,不知道自己理解的是否透徹,只能在以后的實踐中慢慢探索了。