意義
可能覺得這是在做了一個輪子,回想當初學(xué)習http協(xié)議時,需要了解各種協(xié)議頭的作用,但是那時候只是在學(xué)習,沒有真正去測試http各種頭部的含義。在此,重新做了一個靜態(tài)文件服務(wù)器,以學(xué)習http知識及dotnet應(yīng)用。
一、使用控制臺制作服務(wù)
(1)簡單http服務(wù)
生成socket服務(wù),綁定IP和端口
Socket socket = new Socket(AddressFamily.InterNetwork, SocketType.Stream, ProtocolType.Tcp);
socket.Bind(new IPEndPoint(IPAddress.Any, 10080));
socket.Listen(100);
//接收客戶端的 Socket請求
socket.BeginAccept(OnAccept, socket);
每個HTTP請求處理
var serverSocket = async.AsyncState as Socket;
//獲取到客戶端的socket
var clientSocket = serverSocket.EndAccept(async);
//進行下一步監(jiān)聽
serverSocket.BeginAccept(OnAccept, serverSocket);
//響應(yīng)頭部部分
clientSocket.Send(Encoding.UTF8.GetBytes(responseHeader));
//響應(yīng)body部分
clientSocket.Send(Encoding.UTF8.GetBytes(response_text));
(2)處理request信息
var bytes = new byte[10000];
//獲取socket的內(nèi)容
var len = clientSocket.Receive(bytes);
//request為請求頭,將 bytes[] 轉(zhuǎn)換 string
var request = Encoding.UTF8.GetString(bytes, 0, len);
//從請求頭中獲取path部分“GET /index.html HTTP/1.1”
var filePath = request.Split("\r\n")[0].Split(" ")[1].TrimStart('/');
request的頭部內(nèi)容
GET /index.html HTTP/1.1
Host: 127.0.0.1:10080
Connection: keep-alive
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9
Sec-Fetch-Site: none
Sec-Fetch-Mode: navigate
Sec-Fetch-User: ?1
Sec-Fetch-Dest: document
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8,ja;q=0.7
Cookie: _ga=GA1.1.1017728174.1598968861
(3)處理響應(yīng)頭部
HTTP/1.1 {0}
Date: {1}
Expires: {2}
Server: {3}
Content-Type: {4}
Cache-Control: max-age=86400
Connection: keep-alive
Content-Length: {5}
http_status_code,
System.DateTime.Now.ToString("R"),
DateTime.Now.AddDays(1).ToString("R"),
"WebServer",
content_type,
content_length
注意:響應(yīng)頭部最后有兩個回車換行“\r\n\r\n”。
處理狀態(tài)碼
最常用狀態(tài)碼為200、404,在正確返回文件時,返回200狀態(tài)碼,當文件不存在時,需要返回404狀態(tài)碼。簡單文件服務(wù)器一般不使用其他狀態(tài)碼
var http_status_code = "200 OK"; //設(shè)置默認狀態(tài)碼
http_status_code = "404 Not Found"; //當文件不存在時響應(yīng)404狀態(tài)碼
Content-Type的判斷
參考Nginx程序的響應(yīng)方式,將/nginx/conf/mime.types
文件解析成Dictionary類型的數(shù)據(jù),從請求文件中獲取到文件的擴展名,對應(yīng)到mime-type。
Content-Length的計算
//字節(jié)流計算
response_file = System.IO.File.ReadAllBytes(filePath);
BitArray myBA = new BitArray(response_file);
content_length = Convert.ToInt32(myBA.Length / 8);
//文本類型
response_text = System.IO.File.ReadAllText(filePath, Encoding.UTF8);
content_length = Encoding.UTF8.GetByteCount(response_text);
Content-Length可不返回,但是返回就必須和真實的文件大小一致。
(4)響應(yīng)字節(jié)流文件
response_file = System.IO.File.ReadAllBytes(filePath);
BitArray myBA = new BitArray(response_file);
content_length = Convert.ToInt32(myBA.Length / 8);
(5)響應(yīng)文本文件
response_text = System.IO.File.ReadAllText(filePath, Encoding.UTF8);
content_length = Encoding.UTF8.GetByteCount(response_text);
(6)特殊文件處理
默認首頁
if(filePath == "" || filePath == "/")
{
filePath = "index.html";
}
// 以`/`為末尾的,默認獲取該目錄下的`index.html`文件
if(filePath.Substring(filePath.Length - 1, 1) == "/")
{
filePath = filePath + "index.html"; //默認頁面
}
文件不存在時
//獲取文件內(nèi)容
try
{
// ... 獲取文件,若獲取失敗,則拋出異常
}
catch (Exception e)
{
http_status_code = "404 Not Found";
response_text = System.IO.File.ReadAllText(webpath + "404.html", Encoding.UTF8);
content_type = "text/html";
content_length = Encoding.UTF8.GetByteCount(response_text);
}
去除問號訪問
if (filePath.Contains("?"))
{
filePath = filePath.Split("?")[0];
}
(7)效果預(yù)覽
總結(jié)
做簡易自主的本地靜態(tài)文件服務(wù)器,效果還是不錯的。之后做成桌面應(yīng)用程序,雙擊軟件即運行站點。
TODO+優(yōu)化
- 未處理子目錄下的默認文件,例如
/html/
要訪問到/html/index.html
【已完成】 - 服務(wù)端沒有找到文件時,要返回404狀態(tài)碼和默認404頁面。【已完成】
- 獲取請求頭的host,訪問到不同的站點(虛擬主機)。
- 帶參數(shù)時獲取不到文件,例如
index.html?id=123
需要把?
及后面的參數(shù)過濾,帶#
的URL無需處理。【已完成】 - 每個HTTP請求都占用一個連接,需要保持同一個TCP連接請求。
資源消耗
Nginx占用內(nèi)存1.5MB,該應(yīng)用占用25MB,當然是不能和Nginx相比較的。
HTTP頭部問題
-
Pragma: no-cache
需要去掉,避免緩存失效。 -
Cache-Control: max-age=86400
設(shè)置緩存1天。 - 請求頭的操作,HTTP服務(wù)端指定的Host是以頭部的Host為準,URL上的Host是無效的。
C:\Users\admin>curl http://127.0.0.1/ -H "Host: fe80.cn" -v
* Trying 127.0.0.1...
* TCP_NODELAY set
* Connected to 127.0.0.1 (127.0.0.1) port 80 (#0)
> GET / HTTP/1.1
> Host: fe80.cn
> User-Agent: curl/7.55.1
> Accept: */*
“你的主機中的軟件中止了一個已建立的連接”的問題
出現(xiàn)原因:
1、由于客戶端在發(fā)送請求后,還沒等服務(wù)器響應(yīng)就斷開了連接,有可能是因為網(wǎng)絡(luò)原因,突然網(wǎng)斷了,但是如果錯誤頻繁出現(xiàn)的話,可能就是服務(wù)端的問題了。
2、有可能是后臺處理時間太長了。
3、服務(wù)器的并發(fā)連接數(shù)超過了其承載量,服務(wù)器會將其中一些連接Down掉。
4、客戶關(guān)掉了瀏覽器,而服務(wù)器還在給客戶端發(fā)送數(shù)據(jù)。
5、出現(xiàn)404或者獲取不到文件時出現(xiàn)該問題。
6、訪問過于頻繁時404的文件報該問題。
等其他原因,但這個問題還沒有解決。
使用Wireshark抓包
過濾參數(shù) http && tcp.port == 10080
通過抓包發(fā)現(xiàn),一個請求有兩個響應(yīng)。后面查到該請求的request
為空,因此應(yīng)該不做處理,否則返回200的空響應(yīng)會終止該連接。