面試過程中,常常遇到這樣一道面試題,輸入URL到頁面加載完畢,瀏覽器做了哪些工作?
首先輸入一個URL,你會看到瀏覽器上面的標(biāo)簽頁出現(xiàn)了一個loading圖標(biāo),開始時是逆時針旋轉(zhuǎn),接著順時針旋轉(zhuǎn),當(dāng)前頁面消失,顯示我們常說的空白頁面,接著出現(xiàn)顯示我們請求的新頁面。此時如果網(wǎng)絡(luò)很差,你有可能看到短暫的DOM頁面,然后再看到渲染后的正常頁面,這是從表面看到的加載過程,實際瀏覽器做的要多得多。
為什么瀏覽器這么多戲呢?直接顯示不好嗎,當(dāng)然不行,就像喝粥,能直接吃米、喝水嗎?
在用戶輸入URL到頁面展示,瀏覽器要先向服務(wù)器獲取前端資源,然后再將服務(wù)器返回的字節(jié)流轉(zhuǎn)化成對應(yīng)的頁面,每一階段都需要瀏覽器對應(yīng)的能力進(jìn)行處理的。
作為前端開發(fā),了解整個過程其實很重要,只有知道了瀏覽器加載頁面的整個過程,才能在開發(fā)中避免可能跳的坑,才能在發(fā)現(xiàn)問題后迅速定位問題,才能在性能優(yōu)化時提出更多的解決方案。
比如下面問題,看了文章相信你就知道了為什么了
為什么會存在空白頁面?(為了解決這個問題,各大廠都在實踐各種方案)
為什么js要在Dom后面引入
為什么有個頁面崩潰會導(dǎo)致多個頁面崩潰
瀏覽器的緩存策略是怎樣的?
為什么我們常常修改host就可以訪問對應(yīng)的域名
等等
為了看懂下面的內(nèi)容,這里必須要了解下現(xiàn)代瀏覽器的多進(jìn)程架構(gòu)
,進(jìn)程
和線程
的關(guān)系等知識點。
瀏覽器也是從單個進(jìn)程架構(gòu)一步步迭代到現(xiàn)代的多進(jìn)程架構(gòu)。
如上圖,我們可以看到線程
和進(jìn)程
的關(guān)系
通常一個程序?qū)嵗褪且粋€進(jìn)程,瀏覽器會為他分配內(nèi)存空間。
一個進(jìn)程間的數(shù)據(jù)是共享的,單線程就是一個進(jìn)程包含一個線程,一個線程處理所有的任務(wù)
多線程就是,一個進(jìn)程中包含多個線程可以同時執(zhí)行任務(wù),共享數(shù)據(jù)和內(nèi)存
線程不能多帶帶存在,必須依附于進(jìn)程,一個線程失敗,會導(dǎo)致進(jìn)程執(zhí)行失敗,進(jìn)程銷毀,內(nèi)存會被立即回收。
下圖是我們打開一個掘金首頁后,再打開任務(wù)管理器,觀察發(fā)現(xiàn),此時瀏覽器包括的進(jìn)程有很多,瀏覽器主進(jìn)程,GPU進(jìn)程,網(wǎng)絡(luò)進(jìn)程,存儲進(jìn)程,音頻進(jìn)程,渲染進(jìn)程,多個插件進(jìn)程。
這些進(jìn)程負(fù)責(zé)的功能如下:
進(jìn)程 | 說明 |
---|---|
瀏覽器進(jìn)程 | 負(fù)責(zé)瀏覽器各個子進(jìn)程的通信,處理瀏覽器界面,包括地址欄等 |
渲染進(jìn)程 | 也就是我們看到的圖中的標(biāo)簽頁進(jìn)程,也就是我們常說的瀏覽器內(nèi)核,v8就在這個進(jìn)程。主要負(fù)責(zé)解析html、js、css渲染頁面等 |
網(wǎng)絡(luò)進(jìn)程 | 負(fù)責(zé)發(fā)起網(wǎng)絡(luò)請求,解析返回頭信息 |
GUI進(jìn)程 | 負(fù)責(zé)將渲染進(jìn)程生成的圖塊轉(zhuǎn)化成位圖 |
渲染進(jìn)程是運行在沙箱之中的,可以執(zhí)行js,但是不能獲取系統(tǒng)權(quán)限,和瀏覽器進(jìn)程通過IPC通訊。這是為了保證瀏覽器進(jìn)程的安全,鎖進(jìn)沙箱,即使有惡意代碼,也不能突破沙箱讀取或?qū)懭胂到y(tǒng)信息。
通過上圖,我們已經(jīng)知道線程是不能獨立存在的,必須依附于進(jìn)程。這里我們主要關(guān)注下渲染進(jìn)程,因為他的主要工作就是:完成頁面的渲染和展示。
如圖,我們可以看到渲染進(jìn)程包括很多線程,除了圖上展示的,還有合成線程等,各有各的作用,具體內(nèi)容,我們將會在后面一章節(jié),瀏覽器渲染原理分析中在來討論。
從用戶輸入域名到瀏覽器渲染頁面完成的過程,可以分為以下幾個部分:
1、輸入信息處理
2、網(wǎng)絡(luò)請求
3、服務(wù)器返回請求資源
4、瀏覽器渲染
這里每一步涉及到的知識都非常多,其中緩存也在每個階段占了很大比重,接著展開描述前三個階段:
當(dāng)輸入一個URL,瀏覽器會判斷輸入信息是檢索信息還是請求URL
如果是檢索的信息,就構(gòu)建請求搜索的URL,調(diào)用瀏覽器默認(rèn)的搜索引擎進(jìn)行檢索。
如果符合URL格式,瀏覽器主進(jìn)程就通過IPC通信機(jī)制將URL發(fā)送給網(wǎng)絡(luò)進(jìn)程。
1)網(wǎng)絡(luò)進(jìn)程首先會查找瀏覽器緩存,判斷緩存是否存在,是否過期
如果存在且不過期,就直接返回緩存信息。具體的緩存策略可以接著看下面的瀏覽器緩存策略
2)如果沒有緩存或過期,就開始進(jìn)行DNS解析
DNS解析的過程也很復(fù)雜,最終目的就是拿到目標(biāo)主機(jī)的IP地址,具體的解析過程可以看下面的域名解析
3)建立http連接或https連接
http通過三次握手建立連接
https需要建立TLS連接,瀏覽器會驗證網(wǎng)站的數(shù)字證書是否合法,是否到期,是否安全等,這里https有自己的一套認(rèn)證邏輯,我們重點不在這一塊。
這里兩個問題常被問到,不了解可以學(xué)習(xí)一下
http和https的區(qū)別?
簡述三次握手、四次揮手?
4)發(fā)送請求
網(wǎng)絡(luò)進(jìn)程會構(gòu)建http請求頭,向服務(wù)器發(fā)送實際請求
5)網(wǎng)絡(luò)傳輸,服務(wù)器處理,返回對應(yīng)的資源
請求從應(yīng)用層發(fā)出,經(jīng)過運輸層、網(wǎng)絡(luò)層、物理層、數(shù)據(jù)鏈路層找到服務(wù)器,服務(wù)器拿到請求信息,返回對應(yīng)的資源
這里的服務(wù)器可能是代理服務(wù)器,也可能是CDN節(jié)點,會判斷當(dāng)前數(shù)據(jù)是否存在緩存,如果有緩存且有效,直接返回(具體看配置的緩存策略),否則才會從服務(wù)器獲取。
網(wǎng)絡(luò)傳輸數(shù)據(jù)也是很復(fù)雜的過程,具體可以看下面簡單的介紹計算機(jī)網(wǎng)絡(luò)體系模型
1)處理返回信息
瀏覽器接收到服務(wù)器返回的資源信息,網(wǎng)絡(luò)進(jìn)程首先會解析返回的頭信息,查看是否有Location字段,如果有的話,再次發(fā)起請求,很常見的就是請求http的站點,然后重定向到https。
如下圖我們輸入的是http://www.taobao.com/
,接口返回307內(nèi)部重定向,然后瀏覽器再次進(jìn)行了請求https//www.taobao.com/
通過返回頭字段Content-Type
判斷文件類型,如果其他類型,就調(diào)用不同的進(jìn)程處理,如果是html類型,繼續(xù)處理。
網(wǎng)絡(luò)進(jìn)程拿到返回的資源信息,會發(fā)送消息“提交導(dǎo)航”到瀏覽器主進(jìn)程,瀏覽器主進(jìn)程發(fā)送信息“提交文檔”,提醒渲染進(jìn)程準(zhǔn)備接收返回的資源信息
渲染進(jìn)程和網(wǎng)絡(luò)進(jìn)程構(gòu)建通道,接收資源信息,并發(fā)送消息“提交文檔”給瀏覽器主進(jìn)程,告訴瀏覽器主進(jìn)程我準(zhǔn)備好了,瀏覽器主進(jìn)程開始刷新頁面,url、安全等信息。
此時頁面將會觸發(fā)beforeunload
事件,在頁面退出之前允許用戶選擇終止該流程(常應(yīng)用于表單提交頁面)。如果不監(jiān)控該方法,瀏覽器就直接替換當(dāng)前頁面。
然后在渲染線程繪制出頁面的之前,頁面將存在空白時間,這就是各個技術(shù)團(tuán)隊在攻克的技術(shù)點,怎樣讓空白時間最短,這個時間取決于當(dāng)前頁面渲染的時長,那么我們還是要了解下瀏覽器是如何渲染服務(wù)器返回的資源。
8)四次揮手
資源傳輸完畢,斷開連接
我們打開任務(wù)管理器,看到如下圖所示
我們發(fā)現(xiàn)很多標(biāo)簽頁都是多帶帶的一個進(jìn)程,但是其中一些標(biāo)簽頁確是共用一個渲染進(jìn)程,為什么會這樣?
其實瀏覽器對于在當(dāng)前站點打開的新Tab頁面會做一些優(yōu)化,如果他們同源,且執(zhí)行環(huán)境相同,會直接復(fù)用當(dāng)前站點的渲染進(jìn)程。
這樣就可以提高渲染的性能,也能讓父窗口和子窗口建立關(guān)聯(lián),但這樣也造成了一定的隱患
公用一個進(jìn)程,如果當(dāng)前進(jìn)程中的一個線程出現(xiàn)問題,當(dāng)前進(jìn)程就會崩潰,公用同一個進(jìn)程的頁面也會崩潰。
如果有惡意腳本就可以攻擊新打開的頁面,在新打開的頁面中我們可以通過window.opener
獲取父頁面的操作權(quán)限
如果沒有關(guān)聯(lián)
如果有關(guān)聯(lián)
這就是我們現(xiàn)實中可能會遇到的一個頁面奔潰,其他同源站點全部退出的現(xiàn)象。
那么這種共同使用一個渲染進(jìn)程是如果出現(xiàn)的呢?在日常編碼中我們常常有這三種方式:
一般情況下,項目中我們跳轉(zhuǎn)采用a標(biāo)簽,如果調(diào)整的是同源頁面,會出現(xiàn)
<a href="http://www.baidu.com"></a> 復(fù)制代碼
該方法使用最新版的谷歌測試發(fā)現(xiàn),在當(dāng)前頁面內(nèi)打開一個同源的站點,使用的是獨立的進(jìn)程,這和預(yù)期的不符合,后面會繼續(xù)測試看看。
但是一般情況下,我們可以給a標(biāo)簽加上屬性rel="noopener norefferrer"
來保證不同頁面使用不同的進(jìn)程。
window.open("http://www.baidu.com") 復(fù)制代碼
使用window.open
打開相同站點,肯定會出現(xiàn)使用同一個渲染進(jìn)程,如果要規(guī)避,就要增加如下代碼,去除兩者的關(guān)聯(lián)
let newWin = window.open("http://my.dome.com") newWin.opener = null 復(fù)制代碼
頁面中采用iframe框架引入其他頁面,則iframe會獨立成輔助框架,有自己的渲染進(jìn)程,如果同源會采用同一個渲染進(jìn)程。
存儲策略
強(qiáng)緩存
協(xié)商緩存
瀏覽器的緩存策略,有助于提高網(wǎng)頁加載速度,減輕服務(wù)器壓力。
具體緩存的過程如圖:
詳細(xì)說明:
1、當(dāng)我們輸入url,瀏覽器會去查看自身是否有緩存,如果沒有緩存會直接請求服務(wù)器獲取資源,并緩存到瀏覽器一份,返回數(shù)據(jù)會攜帶ETag
字段和Last-Modified
字段,狀態(tài)碼200 OK(from memory cache),
其中ETag
是文件計算的hash值,如果文件不發(fā)生改變,這個值不會變。Last-Modified
是文件最后的修改時間,如果文件更新或者覆蓋就會顯示最新的時間
2、如果瀏覽器有緩存,此時檢查http的請求頭,看cache-control、expires字段,判斷是否過了緩存的有效期,如果沒有過有效期,則返回200狀態(tài)碼和對應(yīng)的緩存數(shù)據(jù)。
此時是強(qiáng)緩存
expires是http1.0的定義,返回一個絕對的時間GMT,為過期時間。這就導(dǎo)致如果服務(wù)器時間和瀏覽器時間不一致,可能會使緩存失效。
cache-control是http1.1的定義,可以定義的值有
max-age=600 表示最長有效期為600s
no-cache 不走瀏覽器緩存,每次都去瀏覽器協(xié)商緩存
no-store 每次都請求最新的資源
private 私有,只能在用戶終端緩存,不能在cdn或代理服務(wù)器緩存
public 公有,可以在所有節(jié)點緩存
兩者同時存在,cache-control優(yōu)先級高
3、如果瀏覽器緩存已過期,就攜帶請求頭字段If-None-Match
和If-Modified-Since
去服務(wù)器拉取資源,服務(wù)器看到這兩個字段,發(fā)現(xiàn)和當(dāng)前服務(wù)器資源一致,就直接返回緩存和狀態(tài)碼304。服務(wù)器一般會先驗證If-None-Match/ETag
,如果不變,再去驗證If-Modified-Since/Last-Modified
其中If-Modified-Since
就是之前返回的Last-Modified
,If-None-Match
就是之前返回的ETag
如果第一次請求,默認(rèn)沒有緩存,瀏覽器將會進(jìn)行緩存,瀏覽器緩存的都是派生文件, 比如css、js、img等不常變動的文件,內(nèi)存緩存肯定比較小,所以會緩存一下js,頁面關(guān)閉就清空了,disk memory 會在的時間會久一點。
DNS就是域名系統(tǒng),作用是將域名解析成對應(yīng)的IP地址。具體的解析過程
1、輸入一個url,首先瀏覽器會對url進(jìn)行解析,取出主機(jī)名
2、接著查找瀏覽器自身的DNS緩存,查到返回對應(yīng)IP
3、沒有找到,在本機(jī)找Host文件是否有對應(yīng)的IP(host文件就是域名和ip的映射關(guān)系表),查到就返回IP
3、沒有的話,本地DNS服務(wù)器開始查找,向各級的DNS服務(wù)器發(fā)送查詢報文,獲取對應(yīng)的IP地址
在每次查找的過程中,瀏覽器,應(yīng)用程序,DNS服務(wù)器都會對域名進(jìn)行緩存,如果命中緩存,DNS會直接返回對應(yīng)的IP,沒有命中則繼續(xù)查找相關(guān)的域名服務(wù)器,定位IP
分析可知這個階段,我們能優(yōu)化的方法有限,常見的做法有:
1、在html文件增加DNS緩存標(biāo)簽
2、通過將域名解析到多個IP,做DNS的負(fù)載均衡
<link rel="dns-prefetch" href="//g.alicdn.com" /> 復(fù)制代碼
上面代碼,會預(yù)取g.test.com
解析
<meta http-equiv="x-dns-prefetch-control" content="on"> 復(fù)制代碼
上面代碼,設(shè)置自動開啟DNS解析功能
這里的網(wǎng)絡(luò)請求,我們默認(rèn)為http請求。
1、首先如果是第一次請求,域名經(jīng)過DNS解析拿到映射的IP
2、這里客戶端發(fā)送http報文給對應(yīng)的服務(wù)器,這個過程中要經(jīng)過應(yīng)用層、運輸層、網(wǎng)絡(luò)層、數(shù)據(jù)鏈路層和物理層對數(shù)據(jù)報的層層處理
3、經(jīng)過上一步的三次確認(rèn),也就是客戶端和服務(wù)器(或代理服務(wù)器)進(jìn)行三次握手建立TCP連接
4、然后服務(wù)器返回對應(yīng)的資源給客戶端
5、如果是第二次及以上的請求,瀏覽器或服務(wù)器會通過http的header參數(shù),判斷資源是否過期,如果沒有過期,則使用緩存,如果過期,就去服務(wù)器拿新的資源
第二步,這里客戶端發(fā)送http報文給對應(yīng)的服務(wù)器,具體的過程為:
1、首先應(yīng)用層提供了很多協(xié)議,包括:http、ftp、POP3、IMAP,這里瀏覽器使用的是http協(xié)議,首先瀏覽器會在應(yīng)用層,把請求的數(shù)據(jù)報按照http協(xié)議要求的格式,定義一系列請求的字段,推進(jìn)TCP套接字,等待運輸層接收。
2、運輸層主要的協(xié)議有:TCP和UDP,運輸層拿到數(shù)據(jù)報以后,會先看是否和目的主機(jī)建立連接,如果沒有,則進(jìn)行三次握手,建立TCP連接。如果連接成功,會對數(shù)據(jù)報進(jìn)一步封裝,增加源主機(jī)端口號和目的主機(jī)端口號,進(jìn)行差錯檢測,然后傳遞到網(wǎng)絡(luò)層。
3、網(wǎng)絡(luò)層主要協(xié)議有:IP協(xié)議,接收運輸層的數(shù)據(jù)報,然后增加目的主機(jī)IP,封裝成一段段符合IP協(xié)議的IP數(shù)據(jù)報,經(jīng)過若干個路由到達(dá)數(shù)據(jù)鏈路層
4、數(shù)據(jù)鏈路層有ARP協(xié)議,可以通過IP地址解析目標(biāo)地址的mac地址,通過物理層轉(zhuǎn)發(fā)出去,到達(dá)目的局域網(wǎng)后,通過廣播,被目的主機(jī)接收
服務(wù)器獲取請求,協(xié)商緩存查看資源是否有變化,如果沒有變化返回緩存資源。
CDN緩存
這里如果存在代理服務(wù)器或者CDN節(jié)點,那么相當(dāng)于增加了一個緩存節(jié)點,首先請求會轉(zhuǎn)發(fā)到最新的CDN節(jié)點,CDN節(jié)點收到請求后會判斷當(dāng)前資源是否過期cache-control
,如果過期就回源請求最新的資源,如果沒有過期就返回緩存資源。
CDN的存在解決了跨地域請求的時延問題;對服務(wù)器壓力進(jìn)行了分流。
四次揮手:如果請求結(jié)束,服務(wù)器和客戶端進(jìn)行四次握手,斷開連接。
具體的渲染是很復(fù)雜的,篇幅有限,接著下一篇繼續(xù)。
瀏覽器為什么要進(jìn)行url解析,編碼規(guī)則是什么,如何解析
域名解析的過程,遞歸查詢,迭代查詢
網(wǎng)絡(luò)請求三次握手、四次揮手原理,為什么要三次握手,兩次不行嗎
網(wǎng)絡(luò)請求的過程,計算機(jī)網(wǎng)絡(luò)體系
ping的原理是什么
http緩存的分類,強(qiáng)緩存和協(xié)商緩存、啟發(fā)式緩存
如何設(shè)置http緩存
http和https區(qū)別,不同版本的區(qū)別
瀏覽器的渲染原理、渲染順序
頁面渲染優(yōu)化
什么是重繪和回流
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.hztianpu.com/yun/127955.html
摘要:分層由高到低分別為應(yīng)用層傳輸層網(wǎng)絡(luò)層數(shù)據(jù)鏈路層。狀態(tài)碼由三位數(shù)字組成,其中比較常見的是表示請求成功。在返回狀態(tài)碼的同時,響應(yīng)報文也會附帶重定向的,客戶端接收到后將請求的做相應(yīng)的改變再重新發(fā)送。 當(dāng)在瀏覽器地址欄輸入網(wǎng)址,如:http://cn.bing.com 后瀏覽器是怎么把最終的頁面呈現(xiàn)出來的呢?這個過程可以大致分為兩個部分:網(wǎng)絡(luò)通信和頁面渲染。 一、網(wǎng)絡(luò)通信 互聯(lián)網(wǎng)內(nèi)各網(wǎng)絡(luò)設(shè)備間...
摘要:在上述過程再細(xì)化為瀏覽器搜索自己的緩存。至此,瀏覽器已經(jīng)得到了域名對應(yīng)的地址。具體過程如下在中這一過程如下首先是字節(jié)流,經(jīng)過解碼之后是字符流,然后通過詞法分析器會被解釋成詞語,之后經(jīng)過語法分析器構(gòu)建成節(jié)點,最后這些節(jié)點被組建成一棵樹。 面試的時候,我們經(jīng)常會被問從在瀏覽器地址欄中輸入 url 到頁面展現(xiàn)的短短幾秒內(nèi)瀏覽器究竟做了什么?那么瀏覽器到底做了啥? 瀏覽器的多進(jìn)程架構(gòu)一個好的程...
摘要:在上述過程再細(xì)化為瀏覽器搜索自己的緩存。至此,瀏覽器已經(jīng)得到了域名對應(yīng)的地址。具體過程如下在中這一過程如下首先是字節(jié)流,經(jīng)過解碼之后是字符流,然后通過詞法分析器會被解釋成詞語,之后經(jīng)過語法分析器構(gòu)建成節(jié)點,最后這些節(jié)點被組建成一棵樹。 面試的時候,我們經(jīng)常會被問從在瀏覽器地址欄中輸入 url 到頁面展現(xiàn)的短短幾秒內(nèi)瀏覽器究竟做了什么?那么瀏覽器到底做了啥? 瀏覽器的多進(jìn)程架構(gòu)一個好的程...
摘要:在上述過程再細(xì)化為瀏覽器搜索自己的緩存。至此,瀏覽器已經(jīng)得到了域名對應(yīng)的地址。具體過程如下在中這一過程如下首先是字節(jié)流,經(jīng)過解碼之后是字符流,然后通過詞法分析器會被解釋成詞語,之后經(jīng)過語法分析器構(gòu)建成節(jié)點,最后這些節(jié)點被組建成一棵樹。 面試的時候,我們經(jīng)常會被問從在瀏覽器地址欄中輸入 url 到頁面展現(xiàn)的短短幾秒內(nèi)瀏覽器究竟做了什么?那么瀏覽器到底做了啥? 瀏覽器的多進(jìn)程架構(gòu)一個好的程...
摘要:文章同步到技術(shù)內(nèi)幕之頁面渲染過程最近拜讀了傳說中的技術(shù)內(nèi)幕一書,有很大收獲,尤其是對頁面渲染有了較深的認(rèn)識。解析語法分析,基于詞法解釋器生成的新標(biāo)記,構(gòu)建成抽象語法樹,解析器嘗試將其與某條語法規(guī)則進(jìn)行匹配。 文章同步到github《Webkit技術(shù)內(nèi)幕》之頁面渲染過程 最近拜讀了傳說中的《Webkit技術(shù)內(nèi)幕》一書,有很大收獲,尤其是對頁面渲染有了較深的認(rèn)識。由于功力有限,而且書中設(shè)...
閱讀 1583·2025-02-07 13:29
閱讀 1008·2024-11-07 18:25
閱讀 131504·2024-02-01 10:43
閱讀 1380·2024-01-31 14:58
閱讀 1149·2024-01-31 14:54
閱讀 83576·2024-01-29 17:11
閱讀 3879·2024-01-25 14:55
閱讀 2395·2023-06-02 13:36