無論是開發(fā)者或者普通計算機用戶,我們都經(jīng)常使用瀏覽器查詢資料,那么是否想過這個問題:從輸入URL到我們的頁面展示,這中間都發(fā)生了什么呢?
本文瀏覽器以chrome瀏覽器舉例說明,開始之前,你需要知道目前chrome瀏覽器是多進程瀏覽器,進程包括網(wǎng)路進程,渲染進程,瀏覽器進程等多個進程(以后有空會分享一個chrome瀏覽器的發(fā)展史),那么到底這個過程都發(fā)生了什么呢?且聽我一步一步分析~
首先這個過程可以從宏觀和微觀兩個方面著手。
宏觀:大概只有兩步:導航流程-->渲染流程;本文主要敘述導航階段。
微觀:大概有25步左右,但是當遇到特殊情況,比如出現(xiàn)重定向,緩存,瀏覽器請求下載資源的時候,會少于15步。
1,首先當用戶在地址欄輸入信息的時候,瀏覽器會首先辨認你搜索的是一個關(guān)鍵字的索引還是一個網(wǎng)址,如果是一個索引內(nèi)容的時候,就會把你的關(guān)鍵字+默認的搜索引擎合成新的URL;比如我在地址欄輸入shanyeqiaozhi就會出現(xiàn)這樣的拼接URL:google.com/searchq=shanyiqiaozhi&oq=shanyiqiaozhi&aqs=chrome..69i57.3032j0j1&sourceid=chrome&ie=UTF-8。 但是當你在地址欄直接搜索baidu.com的時候,這樣的搜索符合URL規(guī)則,瀏覽器會根據(jù)URL協(xié)議,在baidu.com的前面加上協(xié)議變成合法的URL。(https://www.baidu.com)。
2,當你輸入完內(nèi)容之后,點擊搜索或者按下回車鍵,瀏覽器前進后退箭頭的后面那個循環(huán)標志會動起來,告訴頁面開始進入loading狀態(tài),但是頁面不會馬上呈現(xiàn)新的頁面,因為新的頁面的相應數(shù)據(jù)并沒有獲取到。
3,此時,瀏覽器開始發(fā)起請求,瀏覽器進程構(gòu)建請求頭信息,通過進程間(上述的多進程)的通信(IPC)將URL請求發(fā)送到瀏覽器的網(wǎng)絡進程中。
4,網(wǎng)絡進程得到URL,首先會去本地緩存中查找是否有以前的緩存文件,如果找到,網(wǎng)絡進程會攔截請求,停止操作,直接返回緩存數(shù)據(jù)。否則的話,會繼續(xù)發(fā)送請求。
5,發(fā)送請求的第一步,請求DNS返回域名對應的IP和端口號,如果DNS數(shù)據(jù)緩存服務器也對當前的域名信息進行過緩存(如127.0.0.1一般代表localhost本地域名)。否則發(fā)起請求根據(jù)域名分析出來的IP和端口,如果沒有端口,一般http默認的端口是80,https默認的端口是443。如果是https請求,還會進行TLS鏈接保證數(shù)據(jù)傳輸安全。
6,接下來會進入TCP鏈接,但是chrome有個機制,在同一個域名之下,同時最多能建立6個TCP連接,如果當前的請求數(shù)量少于6個,會直接進行TCP連接,否則的話,會等待連接。
7,這一步涉及到底層傳輸數(shù)據(jù),簡而言之,TCP進行三次握手建立連接,此刻,http請求會加上TCP頭部---包括源端口號,目的程序端口號和用于檢驗數(shù)據(jù)完整性的序號,向下傳輸,到達網(wǎng)絡層,網(wǎng)絡層在數(shù)據(jù)包上加上IP頭部---包括源IP地址和目的IP地址,繼續(xù)向下傳輸?shù)降讓樱讓油ㄟ^物理網(wǎng)絡傳輸給目的服務器主機,目的服務器主機的網(wǎng)絡層接收到了數(shù)據(jù)包,解析處IP地址,識別出數(shù)據(jù)部分,將解開的數(shù)據(jù)包向上傳輸?shù)絺鬏攲樱康姆掌鞯膫鬏攲咏邮艿綌?shù)據(jù)后,解析出TCP頭部,識別端口,將解開的數(shù)據(jù)包向上傳輸?shù)綉脤樱瑧脤親TTP解析請求頭和請求體,如果需要重定向(后端可以重定向響應地址)HTTP直接返回HTTP響應數(shù)據(jù)的狀態(tài)的code值為300/301,同時在請求頭的location字段中附加重定向地址,瀏覽器則根據(jù)code和location進行重定向操作;如果不是重定向,首先服務器會根據(jù)請求頭的if-none-match的值來判斷請求資源是否被更新。如果沒有更新,就返回304狀態(tài)碼,為了告訴瀏覽器以前的緩存數(shù)據(jù)你可以使用,就不用返回給你數(shù)據(jù)了,否則返回新數(shù)據(jù),并且設置code為200。如果瀏覽器想讓瀏覽器進行緩存數(shù)據(jù)的話,就在響應的頭部加上字段:Cache-Contorl:Max-age=2000。此刻,響應數(shù)據(jù)又順著應用層---傳輸層---網(wǎng)絡層---底層(IP尋址)---網(wǎng)絡層---傳輸層---應用層的順序返回到瀏覽器的網(wǎng)絡進程中。
8,網(wǎng)絡進程此刻根據(jù)響應頭的Content-Type字段進行判斷響應數(shù)據(jù)的類型,如果是字節(jié)流類型,就將該請求交給下載管理器,該導航流程就結(jié)束了,不再進行。如果是HTML類型,就通知瀏覽器進程獲取到文檔進行渲染。
9,瀏覽器進程獲取到通知,根據(jù)當前頁面是否在同一站點(同根域名同協(xié)議)來決定是否開啟新的渲染進程。如果是則復用父站點的渲染進程,否則,開啟新的。(此刻完成渲染準備階段,開始數(shù)據(jù)交流)
10,瀏覽器會發(fā)出“提交文檔”的信息給渲染進程,渲染進程收到信息后,會和網(wǎng)絡進程建立數(shù)據(jù)傳輸?shù)摹肮艿馈敝苯舆M行數(shù)據(jù)的傳輸,文檔數(shù)據(jù)傳輸完成后,渲染進程會返回“確認提交”的信息給瀏覽器進程。
11,瀏覽器收到“提交文檔”之后,會更新瀏覽器的頁面狀態(tài),包括了安全狀態(tài),地址欄的URL,前進后退的歷史狀態(tài),并更新web頁面,但此時web頁面是空白頁面。
12,至此,導航流程就算結(jié)束,開始進行到渲染階段......
至于渲染階段,渲染進程如果解析html文檔,如何識別css文件進行排列頁面。今日天色已晚,我們下回分解!