最近在看一本關(guān)于網(wǎng)絡(luò)協(xié)議的書《圖解HTTP》
當(dāng)我們?cè)跒g覽器的地址欄輸入 http://www.pwstrick.com ,然后回車,回車這一瞬間到看到頁面到底發(fā)生了什么呢?
- 域名解析
- 建立TCP連接
- 發(fā)起HTTP請(qǐng)求
- 服務(wù)器響應(yīng)HTTP請(qǐng)求
- 瀏覽器渲染頁面
自己原先不是很了解,通過讀了這本書后了解了些內(nèi)幕。
接下來將使用工具Chrome、Fiddler、Wireshark。
一、基礎(chǔ)概念
1)TCP/IP是互聯(lián)網(wǎng)相關(guān)的各類協(xié)議族的總稱
2)TCP/IP分為4層:應(yīng)用層、傳輸層、網(wǎng)絡(luò)層、鏈路層。
發(fā)送端從應(yīng)用層網(wǎng)下走,接收端從鏈路層網(wǎng)上走。
IP(Internet Protocol):網(wǎng)際協(xié)議位于網(wǎng)絡(luò)層,IP地址可以和MAC地址配對(duì)。
ARP(Address Resolution Protocol):ARP是一種用以解析地址的協(xié)議,根據(jù)通信方的IP地址反查出對(duì)應(yīng)的MAC地址。
Routing:路由選擇,有點(diǎn)像快遞公司的送貨過程。
TCP(Transmission Control Protocol):傳輸控制協(xié)議,提供可靠的字節(jié)流傳輸,將大數(shù)據(jù)分割成報(bào)文段(segment),TCP協(xié)議能夠確認(rèn)數(shù)據(jù)最終是否送達(dá)到對(duì)方。
3)數(shù)據(jù)信息包裝
4)域名解析DNS服務(wù)
DNS(Domain Name System)位于應(yīng)用層,提供域名和IP地址之間的解析服務(wù)。
5)URI和URL
URI(Uniform Resource Identifier):統(tǒng)一資源標(biāo)識(shí)符。
URL(Uniform Resoure Locator):統(tǒng)一資源定位符,通俗的說法是網(wǎng)址。
URI表示某一互聯(lián)網(wǎng)資源,而URL表示資源地點(diǎn),所以URL是URI的子集,下面是幾個(gè)URI資源。
6)RFC
RFC(Request For Comments):征求修正意見書,RFC是互聯(lián)網(wǎng)的設(shè)計(jì)文檔。
要是不按照RFC標(biāo)準(zhǔn)執(zhí)行,就有可能導(dǎo)致無法通信的狀況。
7)HTTP
HTTP是無狀態(tài)協(xié)議,協(xié)議對(duì)于發(fā)送過的請(qǐng)求或響應(yīng)都不做持久化處理。
HTTP/1.1為了實(shí)現(xiàn)保持狀態(tài)的功能,引入了Cookie。
二、域名解析
在《What really happens when you navigate to a URL》中曾提到DNS會(huì)先在緩存中查找記錄。
瀏覽器緩存、系統(tǒng)緩存、路由器緩存、ISP DNS 緩存、遞歸搜索。
三、建立TCP連接
1)發(fā)送端發(fā)送一個(gè)帶SYN標(biāo)志的數(shù)據(jù)包給對(duì)方
Sequence Number:序號(hào);
Acknowledgment Number:確認(rèn)號(hào)。
2)接收端回傳一個(gè)帶有SYN和ACK標(biāo)志的數(shù)據(jù)包以示傳達(dá)確認(rèn)信息
3)發(fā)送端再回傳一個(gè)帶ACK標(biāo)志的數(shù)據(jù)包,代表“握手結(jié)束”
四、發(fā)起HTTP請(qǐng)求
HTTP(Hyper Text Transfer Protocol),超文本傳輸協(xié)議,由請(qǐng)求和響應(yīng)構(gòu)成。
在書本的第3章介紹了HTTP信息。
1)請(qǐng)求報(bào)文
報(bào)文首部?jī)?nèi)容如下:
在書本的第6章中有詳細(xì)的HTTP首部說明。
“Connection:keep-alive”:持久連接,只要任意一端沒有明確提出斷開,就保持TCP連接狀態(tài)。
2)響應(yīng)報(bào)文
報(bào)文首部?jī)?nèi)容如下:
上圖中的200是HTTP狀態(tài)碼,在書中的第4章詳細(xì)介紹了狀態(tài)碼。
五、服務(wù)器響應(yīng)HTTP請(qǐng)求
從上面的響應(yīng)報(bào)文中可以看到服務(wù)器軟件是Nginx,并且請(qǐng)求的是一張PHP頁面。
以前曾經(jīng)寫過一篇《PHP代碼的執(zhí)行》,不過軟件用的是Apache。這里就假設(shè)是Apache+PHP(fastcgi)架構(gòu)提供服務(wù)。
1)Apache
Apache對(duì)HTTP的請(qǐng)求可以分為連接、處理和斷開連接3個(gè)大的階段。同時(shí)也可以分為上圖所示的11個(gè)小的階段。
2)FastCGI
FastCGI可以讓一個(gè)客戶端,從網(wǎng)頁瀏覽器向執(zhí)行在Web服務(wù)器上的程序請(qǐng)求數(shù)據(jù)。
比如現(xiàn)在請(qǐng)求的是“index.php”,根據(jù)配置文件,Apache知道這個(gè)不是靜態(tài)文 件,需要去找PHP解析器來處理,那么它會(huì)把這個(gè)請(qǐng)求簡(jiǎn)單處理后交給PHP解析器。
Apache會(huì)傳url、查詢字符串、POST數(shù)據(jù)、HTTP header等,而CGI就是規(guī)定要傳哪些數(shù)據(jù)、以什么樣的格式傳遞給后方處理這個(gè)請(qǐng)求的協(xié)議。
3)PHP腳本執(zhí)行
PHP程序完成基本的準(zhǔn)備工作后啟動(dòng)PHP及Zend引擎, 加載注冊(cè)的擴(kuò)展模塊。
初始化完成后讀取腳本文件,Zend引擎對(duì)腳本文件進(jìn)行詞法分析,語法分析。
編譯成opcode執(zhí)行。
服務(wù)器最終將生成的HTML代碼返回給瀏覽器。
六、瀏覽器渲染頁面
從Chrome的網(wǎng)絡(luò)工具中可以看到,瀏覽器會(huì)先下載HTML代碼,再去下載CSS或JS外部資源。
網(wǎng)上的很多資料顯示,瀏覽器是邊下載HTML,邊解析HTML的。
有篇文章叫《How browsers work》介紹瀏覽器內(nèi)部工作原理的,文中提到了瀏覽器的渲染引擎——Webkit。
渲染引擎首先通過網(wǎng)絡(luò)獲得所請(qǐng)求文檔的內(nèi)容,通常以8K分塊的方式完成,下面是渲染引擎基本流程:
解析HTML以構(gòu)建DOM樹 -> 構(gòu)建Render(渲染)樹 -> 布局Render樹 -> 繪制Render樹
下圖是Webkit的主流程:
參考資料:
Wireshark基本用法
當(dāng)你輸入一個(gè)網(wǎng)址,實(shí)際會(huì)發(fā)生什么?
一次完整的HTTP事務(wù)是怎樣一個(gè)過程
從輸入url到頁面加載完的過程中都發(fā)生了什么事情
當(dāng)在瀏覽器地址欄輸入一個(gè)URL后回車,將會(huì)發(fā)生的事情?
原文轉(zhuǎn)載至:http://www.cnblogs.com/strick/p/5494869.html