Atitit. http 代理原理 ?atiHttpProxy ?大木馬
?
?
1. 面這張圖可以清晰地闡明HttpProxy的實現原理:1
2. 代理服務器用途1
3. 其中流程具體如下:2
4. 設計規劃3
5. 結束語4
?
?
1.?面這張圖可以清晰地闡明HttpProxy的實現原理:?
2.?代理服務器用途
代理服務器看成是一種擴展瀏覽器功能的途徑。例如,在把數據發送給瀏覽器之前,可以用代理服務器壓縮數據
調試器
數據搜集器
木馬病毒
3.?其中流程具體如下:
?
1、客戶端通過瀏覽器向代理服務器發送HttpRequest(GET/POST);
2、代理服務器讀取請求頭,抽取出請求的具體目標服務器HOST和PORT;
3、代理服務器把請求頭發送給目標服務器;
4、代理服務器建立管道,供客戶端和目標服務器通過兩個Socket通信。
?
?
不管以哪種方式應用代理服務器,其監控HTTP傳輸的過程總是如下:
·?步驟一:內部的瀏覽器發送請求給代理服務器。請求的第一行包含了目標URL。
·?步驟二:代理服務器讀取該URL,并把請求轉發給合適的目標服務器。
·?步驟三:代理服務器接收來自Internet目標機器的應答,把應答轉發給合適的內部瀏覽器。
例如,假設有一個企業的雇員試圖訪問www.cn.ibm.com網站。如果沒有代理服務器,雇員的瀏覽器打開的Socket通向運行這個網站的Web服 務器,從Web服務器返回的數據也直接傳遞給雇員的瀏覽器。如果瀏覽器被配置成使用代理服務器,則請求首先到達代理服務器;隨后,代理服務器從請求的第一 行提取目標URL,打開一個通向www.cn.ibm.com的Socket。當www.cn.ibm.com返回應答時,代理服務器把應答轉發給雇員的 瀏覽器。
當然,代理服務器并非只適用于企業環境。作為一個開發者,擁有一個自己的代理服務器是一件很不錯的事情。例如,我們可以用代理服務器來分析瀏覽器和Web 服務器的交互過程。測試和解決Web應用中存在的問題時,這種功能是很有用的。我們甚至還可以同時使用多個代理服務器(大多數代理服務器允許多個服務器鏈 接在一起使用)。例如,我們可以有一個企業的代理服務器,再加上一個用Java編寫的代理服務器,用來調試應用程序。但應該注意的是,代理服務器鏈上的每 一個服務器都會對性能產生一定的影響。
?
?
4.?設計規劃
正如其名字所示,代理服務器只不過是一種特殊的服務器。和大多數服務器一樣,如果要處理多個請求,代理服務器應該使用線程。下面是一個代理服務器的基本規劃:
1.?等待來自客戶(Web瀏覽器)的請求。
2.?啟動一個新的線程,以處理客戶連接請求。
3.?讀取瀏覽器請求的第一行(該行內容包含了請求的目標URL)。
4.?分析請求的第一行內容,得到目標服務器的名字和端口。
5.?打開一個通向目標服務器(或下一個代理服務器,如合適的話)的Socket。
6.?把請求的第一行發送到輸出Socket。
7.?把請求的剩余部分發送到輸出Socket。
8.?把目標Web服務器返回的數據發送給發出請求的瀏覽器。
當然,如果考慮細節的話,情況會更復雜一些。實際上,這里主要有兩個問題要考慮:第一,從Socket按行讀取數據最適合進一步處理,但這會產生性能瓶 頸;第二,兩個Socket之間的連接必需高效。有幾種方法可以實現這兩個目標,但每一種方法都有各自的代價。例如,如果要在數據進入的時候進行過濾,這 些數據最好按行讀取;然而,大多數時候,當數據到達代理服務器時,立即把它轉發出去更適合高效這一要求。另外,數據的發送和接收也可以使用多個獨立的線 程,但大量地創建和拆除線程也會帶來性能問題。因此,對于每一個請求,我們將用一個線程處理數據的接收和發送,同時在數據到達代理服務器時,盡可能快速地 把它轉發出去。
?
?
?
當代理服務器連接到Web服務器之后,我用一個簡單的循環在兩個Socket之間傳遞數據。這里可能出現一個問題,即如果沒有可操作的數據,調用read 方法可能導致程序阻塞,從而掛起程序。為防止出現這個問題,我用setSoTimeout方法設置了Socket的超時時間(參見Listing 2)。這樣,如果某個Socket不可用,另一個仍舊有機會進行處理,我不必創建一個新的線程。
?
?
和所有線程對象一樣,HttpProxy類的主要工作在run方法內完成(見Listing 2)。run方法實現了一個簡單的狀態機,從Web瀏覽器每次一個讀取字符,持續這個過程直至有足夠的信息找出目標Web服務器。然后,run打開一個通 向該Web服務器的Socket(如果有多個代理服務器被鏈接在一起,則run方法打開一個通向鏈里面下一個代理服務器的Socket)。打開 Socket之后,run先把部分的請求寫入Socket,然后調用pipe方法。pipe方法直接在兩個Socket之間以最快的速度執行讀寫操作。
如果數據規模很大,另外創建一個線程可能具有更高的效率;然而,當數據規模較小時,創建新線程所需要的開銷會抵消它帶來的好處。
Listing 3顯示了一個很簡單的main方法,可以用來測試HttpProxy類。大部分的工作由一個靜態的startProxy方法完成(見Listing 4)。這個方法用到了一種特殊的技術,允許一個靜態成員創建HttpProxy類(或HttpProxy類的子類)的實例。它的基本思想是:把一個 Class對象傳遞給startProxy類;然后,startProxy方法利用映像API(Reflection API)和getDeclaredConstructor方法確定該Class對象的哪一個構造函數接受一個Socket參數;最 后,startProxy方法調用newInstance方法創建該Class對象。
?
?
利用這種技術,我們可以在不創建startProxy方法定制版本的情況下,擴展HttpProxy類。要得到給定類的Class對象,只需在正常的名字 后面加上.class(如果有某個對象的一個實例,則代之以調用getClass方法)。由于我們把Class對象傳遞給了startProxy方法,所 以創建HttpProxy的派生類時,就不必再特意去修改startProxy。(下載代碼中包含了一個派生得到的簡單代理服務器)。
?
?
5.?結束語
利用派生類定制或調整代理服務器的行為有兩種途徑:修改主機的名字,或者捕獲所有通過代理服務器的數據。processHostName方法允許代理服務 器分析和修改主機名字。如果啟用了日志記錄,代理服務器為每一個通過服務器的字符調用writeLog方法。如何處理這些信息完全由我們自己決定――可以 把它寫入日志文件,可以把它輸出到控制臺,或進行任何其他滿足我們要求的處理。writeLog輸出中的一個Boolean標記指示出數據是來自瀏覽器還 是Web主機。
和許多工具一樣,代理服務器本身并不存在好或者壞的問題,關鍵在于如何使用它們。代理服務器可能被用于侵犯隱私,但也可以阻隔偷窺者和保護網絡。即使代理 服務器和瀏覽器不在同一臺機器上,我也樂意把代理服務器看成是一種擴展瀏覽器功能的途徑。例如,在把數據發送給瀏覽器之前,可以用代理服務器壓縮數據;未 來的代理服務器甚至還可能把頁面從一種語言翻譯成另一種語言……可能性永無止境。
?
?
多線程Http代理服務器 Java實現 - 獨上高樓 - ITeye技術網站.htm
用Java開發代理服務器.htm