《TCP/IP網絡編程》學習筆記 | Chapter 24:制作 HTTP 服務器端
- 《TCP/IP網絡編程》學習筆記 | Chapter 24:制作 HTTP 服務器端
- HTTP 概要
- 理解 Web 服務器端
- 無狀態的 Stateless 協議
- 請求消息(Request Message)的結構
- 響應消息(Response Message)的結構
- 實現簡單的 Web 服務器端
- 基于 Windows 的多線程 Web 服務器端
- 基于 Linux 的多線程 Web 服務器端
- 習題
- (1)下列關于 Web 服務器端和 Web 瀏覽器端的說法錯誤的是?
- (2)下列關于 HTTP 協議的描述錯誤的是?
- (3)IOCP 和 epoll 是可以保證高性能的典型服務器端模型,但如果在基于 HTTP 協議的 Web 服務器端使用這些模型,則無法保證一定能得到高性能。請說明原因。
《TCP/IP網絡編程》學習筆記 | Chapter 24:制作 HTTP 服務器端
HTTP 概要
本章將編寫 HTTP(HyperText Transfer Protocol,超文本傳輸協議)服務器端,即 Web 服務器端。
理解 Web 服務器端
HTTP 是以超文本傳輸為目的而設計的應用層協議,基于 TCP/IP 實現。
Web 服務器端就是基于 HTTP 協議,將網頁對應文件傳輸給客戶端的服務器端。
無狀態的 Stateless 協議
HTTP 的請求及相應方式:
從上圖可以看出,服務器端相應客戶端請求后立即斷開連接。換言之,服務器端不會維持客戶端狀態。即使同一客戶端再次發送請求,服務器端也無法辨認出是原先那個,而會以相同方式處理新請求。因此,HTTP 又稱「無狀態的 Stateless 協議」。
現代互聯網為了解決這種缺陷,會使用 Cookie、Session 等保存客戶端信息。詳見于:https://blog.csdn.net/ProgramNovice/article/details/137809102。
請求消息(Request Message)的結構
下面是客戶端向服務端發起請求消息的結構:
從圖中可以看出,請求消息可以分為請求頭、消息頭、消息體 3 個部分。
其中,請求行含有請求方式(請求目的)信息。典型的請求方式有 GET 和 POST ,GET 主要用于請求數據,POST 主要用于傳輸數據。
為了降低復雜度,我們實現只能響應 GET 請求的 Web 服務器端。
「GET/index.html HTTP/1.1」 具有如下含義:請求(GET)index.html 文件,通常以 1.1 版本的 HTTP 協議進行通信。
請求行下面的消息頭中包含發送請求的瀏覽器信息、用戶認證信息等關于 HTTP 消息的附加信息。最后的消息體中裝有客戶端向服務端傳輸的數據,為了裝入數據,需要以 POST 方式發送請求。但是我們的目標是實現 GET 方式的服務器端,所以可以忽略這部分內容。另外,消息體和消息頭與之間以空行隔開,因此不會發生邊界問題。
響應消息(Response Message)的結構
下面是 Web 服務器端向客戶端傳遞的響應信息的結構。從圖中可以看出,該響應消息由狀態行、頭信息、消息體等 3 個部分組成。
狀態行中有關于請求的狀態信息,這是與請求消息相比最為顯著的區別。
第一個字符串狀態行中含有關于客戶端請求的處理結果。例如,客戶端請求 index.html 文件時,表示 index.html 文件是否存在、服務端是否發生問題而無法響應等不同情況的信息寫入狀態行。圖中的「HTTP/1.1 200 OK」具有如下含義:我想以 1.1 版本的 HTTP 協議進行響應,你的請求已正確處理。
這里的數字叫做狀態碼,具體可以通過下面的文章詳細了解:
- https://blog.csdn.net/ProgramNovice/article/details/136882012
- https://blog.csdn.net/ProgramNovice/article/details/126164376
消息頭中含有傳輸的數據類型和長度等信息。圖中的消息頭含有如下信息:服務端名為 SimpleWebServer ,傳輸的數據類型為 text/html。數據長度不超過 2048 個字節。
最后插入一個空行后,通過消息體發送客戶端請求的文件數據。
以上就是實現 Web 服務端過程中必要的 HTTP 協議。
實現簡單的 Web 服務器端
基于 Windows 的多線程 Web 服務器端
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <winsock2.h>
#include <process.h>#define BUF_SIZE 2048
#define BUF_SMALL 100unsigned WINAPI RequestHandler(void *arg);
void SendData(SOCKET sock, char *ct, char *fileName);
void SendErrorMSG(SOCKET sock);
char *ContentType(char *file);
void ErrorHanding(char *message);int main(int argc, char *argv[])
{WSADATA wsaData;SOCKET hServSock, hClntSock;SOCKADDR_IN servAddr, clntAddr;HANDLE hThread;DWORD dwThreadID;int clntAdrSize;if (argc != 2){printf("Usage : %s <port>\n", argv[0]);exit(1);}if (WSAStartup(MAKEWORD(2, 2), &wsaData) != 0)ErrorHanding("WSAStartup() error!");hServSock = socket(PF_INET, SOCK_STREAM, 0);if (hServSock == INVALID_SOCKET)ErrorHanding("socket() error!");memset(&servAddr, 0, sizeof(servAddr));servAddr.sin_family = AF_INET;servAddr.sin_addr.s_addr = htonl(INADDR_ANY);servAddr.sin_port = htons(atoi(argv[1]));if (bind(hServSock, (SOCKADDR *)&servAddr, sizeof(servAddr)) == SOCKET_ERROR)ErrorHanding("bind() error!");if (listen(hServSock, 5) == SOCKET_ERROR)ErrorHanding("listen() error!");while (1){clntAdrSize = sizeof(clntAddr);hClntSock = accept(hServSock, (SOCKADDR *)&clntAddr, &clntAdrSize);if (hClntSock == INVALID_SOCKET)ErrorHanding("accept() error!");printf("Connection Request: %s:%d\n", inet_ntoa(clntAddr.sin_addr), ntohs(clntAddr.sin_port));hThread = (HANDLE)_beginthreadex(NULL, 0, RequestHandler, (void *)hClntSock, 0, (unsigned *)&dwThreadID);}closesocket(hServSock);WSACleanup();return 0;
}unsigned WINAPI RequestHandler(void *arg)
{SOCKET hClntSock = *(SOCKET *)arg;char buf[BUF_SIZE];char method[BUF_SMALL];char ct[BUF_SMALL];char fileName[BUF_SMALL];recv(hClntSock, buf, BUF_SIZE, 0);if (strstr(buf, "HTTP/") == NULL) // 查看是否為 HTTP 提出的請求{SendErrorMSG(hClntSock);closesocket(hClntSock);return 1;}strcpy(method, strtok(buf, " /"));if (strcmp(method, "GET")) // 查看是否為 GET 請求{SendErrorMSG(hClntSock);}strcpy(fileName, strtok(NULL, " /")); // 查看請求文件名strcpy(ct, ContentType(fileName)); // 查看 Content-TypeSendData(hClntSock, ct, fileName);return 0;
}// 讀取文件內容,作為響應數據發送
void SendData(SOCKET sock, char *ct, char *fileName)
{char protocol[] = "HTTP/1.0 200 OK\r\n";char servName[] = "Server:simple web server\r\n";char cntLen[] = "Content-Length:2048\r\n";char cntType[BUF_SMALL];char buf[BUF_SIZE];sprintf(cntType, "Content-Type:%s\r\n\r\n", ct);FILE *fp;if ((fp = fopen(fileName, "r")) == NULL){SendErrorMSG(sock);return;}// 傳輸頭信息send(sock, protocol, strlen(protocol), 0);send(sock, servName, strlen(servName), 0);send(sock, cntLen, strlen(cntLen), 0);send(sock, cntType, strlen(cntType), 0);// 傳輸請求數據while (fgets(buf, BUF_SIZE, fp) != NULL){send(sock, buf, strlen(buf), 0);}closesocket(sock);
}// 返回錯誤響應
void SendErrorMSG(SOCKET sock)
{char protocol[] = "HTTP/1.0 400 Bad Request\r\n";char servName[] = "Server:simple web server\r\n";char cntLen[] = "Content-Length:2048\r\n";char cntType[] = "Content-Type:text/html\r\n\r\n";char content[] = "<html><head><title>NETWORK</title></head>""<body><font size=+5><br>發生錯誤!查看請求文件名和請求方式!</font>""</body></html>";send(sock, protocol, strlen(protocol), 0);send(sock, servName, strlen(servName), 0);send(sock, cntLen, strlen(cntLen), 0);send(sock, cntType, strlen(cntType), 0);send(sock, content, strlen(content), 0);closesocket(sock);
}// 根據文件名的后綴返回對應的 MIME 類型
char *ContentType(char *file)
{char extension[BUF_SMALL];char fileName[BUF_SMALL];strcpy(fileName, file);strtok(fileName, "."); // 取出文件名strcpy(extension, strtok(NULL, ".")); // 取出文件后綴名if (!strcmp(extension, "html") || !strcmp(extension, "htm"))return "text/html";elsereturn "text/plain";
}void ErrorHanding(char *message)
{fputs(message, stderr);fputc('\n', stderr);exit(1);
}
編譯:
gcc webserver_win.c -lws2_32 -o webserv_win
運行結果:
基于 Linux 的多線程 Web 服務器端
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#include <pthread.h>#define BUF_SIZE 1024
#define SMALL_BUF 100void *request_handler(void *arg);
void send_data(FILE *fp, char *ct, char *file_name);
char *content_type(char *file);
void send_error(FILE *fp);
void error_handling(char *message);int main(int argc, char *argv[])
{int serv_sock, clnt_sock;struct sockaddr_in serv_adr, clnt_adr;int clnt_adr_size;char buf[BUF_SIZE];pthread_t t_id;if (argc != 2){printf("Usage : %s <port>\n", argv[0]);exit(1);}serv_sock = socket(PF_INET, SOCK_STREAM, 0);memset(&serv_adr, 0, sizeof(serv_adr));serv_adr.sin_family = AF_INET;serv_adr.sin_addr.s_addr = htonl(INADDR_ANY);serv_adr.sin_port = htons(atoi(argv[1]));if (bind(serv_sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr)) == -1)error_handling("bind() error");if (listen(serv_sock, 20) == -1)error_handling("listen() error");while (1){clnt_adr_size = sizeof(clnt_adr);clnt_sock = accept(serv_sock, (struct sockaddr *)&clnt_adr, &clnt_adr_size);printf("Connection Request : %s:%d\n",inet_ntoa(clnt_adr.sin_addr), ntohs(clnt_adr.sin_port));pthread_create(&t_id, NULL, request_handler, &clnt_sock);pthread_detach(t_id);}close(serv_sock);return 0;
}void *request_handler(void *arg)
{int clnt_sock = *((int *)arg);char req_line[SMALL_BUF];FILE *clnt_read;FILE *clnt_write;char method[10];char ct[15];char file_name[30];clnt_read = fdopen(clnt_sock, "r");clnt_write = fdopen(dup(clnt_sock), "w");fgets(req_line, SMALL_BUF, clnt_read);if (strstr(req_line, "HTTP/") == NULL){send_error(clnt_write);fclose(clnt_read);fclose(clnt_write);return;}strcpy(method, strtok(req_line, " /"));strcpy(file_name, strtok(NULL, " /"));strcpy(ct, content_type(file_name));if (strcmp(method, "GET") != 0){send_error(clnt_write);fclose(clnt_read);fclose(clnt_write);return;}fclose(clnt_read);send_data(clnt_write, ct, file_name);
}
void send_data(FILE *fp, char *ct, char *file_name)
{char protocol[] = "HTTP/1.0 200 OK\r\n";char server[] = "Server:Linux Web Server \r\n";char cnt_len[] = "Content-length:2048\r\n";char cnt_type[SMALL_BUF];char buf[BUF_SIZE];FILE *send_file;sprintf(cnt_type, "Content-type:%s\r\n\r\n", ct);send_file = fopen(file_name, "r");if (send_file == NULL){send_error(fp);return;}// 傳輸頭信息fputs(protocol, fp);fputs(server, fp);fputs(cnt_len, fp);fputs(cnt_type, fp);// 傳輸請求數據while (fgets(buf, BUF_SIZE, send_file) != NULL){fputs(buf, fp);fflush(fp);}fflush(fp);fclose(fp);
}
char *content_type(char *file)
{char extension[SMALL_BUF];char file_name[SMALL_BUF];strcpy(file_name, file);strtok(file_name, ".");strcpy(extension, strtok(NULL, "."));if (!strcmp(extension, "html") || !strcmp(extension, "htm"))return "text/html";elsereturn "text/plain";
}
void send_error(FILE *fp)
{char protocol[] = "HTTP/1.0 400 Bad Request\r\n";char server[] = "Server:Linux Web Server \r\n";char cnt_len[] = "Content-length:2048\r\n";char cnt_type[] = "Content-type:text/html\r\n\r\n";char content[] = "<html><head><title>NETWORK</title></head>""<body><font size=+5><br>發生錯誤! 查看請求文件名和請求方式!""</font></body></html>";fputs(protocol, fp);fputs(server, fp);fputs(cnt_len, fp);fputs(cnt_type, fp);fflush(fp);
}
void error_handling(char *message)
{fputs(message, stderr);fputc('\n', stderr);exit(1);
}
編譯:
gcc webserver_linux.c -D_REENTRANT -o webserver_linux -lpthread
運行結果:
習題
(1)下列關于 Web 服務器端和 Web 瀏覽器端的說法錯誤的是?
a. Web 瀏覽器并不是通過自身創建的套接字連接服務端的客戶端。
b. Web 服務器端通過 TCP 套接字提供服務,因為它將保持較長的客戶端連接并交換數據。
c. 超文本與普通文本的最大區別是其具有可跳轉的特性。
d. Web 服務器端可視為向瀏覽器提供請求文件的文件傳輸服務器端。
e. 除 Web 瀏覽器外,其他客戶端都無法訪問 Web 服務器端。
答:
a、b、e。
(2)下列關于 HTTP 協議的描述錯誤的是?
a. HTTP 協議是無狀態的 Stateless 協議,不僅可以通過 TCP 實現,還可以通過 UDP 來實現
b. HTTP 協議是無狀態的 Stateless 協議,因為其在 1 次請求和響應過程完成后立即斷開連接。因此,如果同一服務器端和客戶端需要 3 次請求及響應,則意味著需要經過 3 次套接字的創建過程。
c. 服務端向客戶端傳遞的狀態碼中含有請求處理結果的信息。
d. HTTP 協議是基于因特網的協議,因此,為了同時向大量客戶端提供服務,HTTP 協議被設計為 Stateless 協議。
答:
a。
(3)IOCP 和 epoll 是可以保證高性能的典型服務器端模型,但如果在基于 HTTP 協議的 Web 服務器端使用這些模型,則無法保證一定能得到高性能。請說明原因。
IOCP 和 epoll 解決了 網絡 I/O 的高效調度,但 Web 服務器的整體性能受制于:
- 應用層邏輯的復雜度。
- HTTP 協議的固有特性,比如:客戶端和服務器端交換 1 次數據后將立即斷開連接,沒有足夠的時間發揮 IOCP 或 epoll 的優勢。
- 系統資源管理,如線程池、內存分配。
- 外部依賴的性能,如數據庫、網絡帶寬。
因此,單純依賴高性能 I/O 模型無法保證 Web 服務器的高性能,需結合協議優化(如 HTTP/2、QUIC)、代碼邏輯優化、分布式架構設計(如負載均衡、緩存)等多方面改進。