在浏览器输入URL之后,它会执行以下几个流程:
- 执行DNS域名解析;
- 封装HTTP请求数据包;
- 封装TCP请求数据包
- 建立TCP连接(3次握手);
- 参数从客户端传递到服务器端;
- 服务器端得到客户端参数之后,进行相应的业务处理,再将结果封装成HTTP包,返回给客户端;
- 服务器端和客户端的交互完成,断开TCP连接(4次挥手);
- 浏览器通过自身执行引擎,渲染并展示最终结果给用户;
DNS域名解析
在网络中定位依靠IP进行身份定位,所以URL访问的第一步便是先要的到服务器端的IP地址。而得到服务器的IP地址需要使用 DNS(Domain Name System,域名系统)域名解析,DNS 域名解析就是通过 URL 找到与之相对应的 IP 地址。
PS:为什么不直接访问 IP 地址来请求服务器?因为 IP 地址很长,不方便记忆,而 URL 地址好记很多,所以会使用 URL 来替代 IP 地址,而 URL 就像 IP 地址的别名一样,用它可以定位到相应的 IP 地址。
DNS 域名解析的大致流程如下:
- 先检查浏览器中的 DNS 缓存,如果浏览器中有对应的记录会直接使用,并完成解析;
- 如果浏览器没有缓存,那就去查询操作系统的缓存,如果查询到记录就可以直接返回 IP 地址,完成解析;
- 如果操作系统没有 DNS 缓存,就会去查看本地 host 文件,Windows 操作系统下,host 文件一般位于 “C:\Windows\System32\drivers\etc\hosts”,如果 host 文件有记录则直接使用;
- 如果本地 host 文件没有相应的记录,会请求本地 DNS 服务器,本地 DNS 服务器一般是由本地网络服务商如移动、电信提供。通常情况下可通过 DHCP 自动分配,当然你也可以自己手动配置。目前用的比较多的是谷歌提供的公用 DNS 是 8.8.8.8 和国内的公用 DNS 是 114.114.114.114。
- 如果本地 DNS 服务器没有相应的记录,就会去根域名服务器查询了,目前全球一共有 13 组根域名服务器(这里并不是指 13 台服务器,是指 13 个 ip 地址,按字母 a-m 编号),为了能更高效完成全球所有域名的解析请求,根域名服务器本身并不会直接去解析域名,而是会把不同的解析请求分配给下面的其他服务器去完成,下面是 DNS 域名系统的树状结构图:
封装HTTP请求数据包
一个 HTTP 请求对象包含 4 部分内容:
- 请求行
- 请求报头
- 空行
- 请求正文
在得到了服务器IP后,紧接着会将本地的请求封装成一个HTTP数据包,如上图所示。
封装TCP请求数据包
HTTP底层是依赖TCP/IP协议实现的,所以在底层数据传输时,会将HTTP请求包进一步封装成TCP数据包。
建立TCP连接(3次握手)
HTTP 通讯的基础是 TCP 连接,TCP 连接需要 3 次握手,3 次握手就是为了验证客户端的发送能力和接收能力,以及服务器端的发生能力和接收能力,就像打电话一样,通常的通话是这样开头的:
- _我_:喂,能听到吗?
- _对方_:能听到,你能听到吗?(证明了对方的接收能力和我的发送能力)
- _我_:我也能听到,咱们聊正事吧。(证明了对方的发送能力和我的接收能力)
经过以上 3 次握手就可以证明客户端的发送能力和接收能力,以及服务器端的发生能力和接收能力,这样就可以正式开始通讯了。
服务器端获取到HTTP请求参数
数据在经过TCP传到服务器程序后,又会将TCP的数据包转换成HTTP数据包(这一切都是 TCP/IP 协议的功劳),这样服务器端就可以得到客户端发送的请求数据了。
服务器端执行业务处理,并返回数据
服务器端拿到了客户端的请求参数之后,会进行相应的业务处理,处理完成之后,再将处理的结果返回给客户端。返回的流程和发送的流程类似,先将结果封装成 HTTP 数据包,HTTP 数据包可分为以下 4 部分:
- 状态行
- 响应报头
- 空行
- 响应正文
它的基本格式如下:
状态行用于描述服务器的返回状态,它由 3 部分组成:
- HTTP 版本号,如 HTTP/1.1;
- 状态码,如 200;
- 状态描述信息,如 OK;
常见的状态码有以下几个:
- 200:返回成功;
- 301:永久重定向;
- 302:临时重定向;
- 404:未找到页面;
- 500:服务器程序出错。
响应正文就是返回给客户端的所有数据。
断开TCP连接(4次挥手)
在经过一次请求和一次响应之后,客户端和服务器的“交流”就结束了,此时就可以执行 TCP 连接断开的流程了,它需要 4 次挥手:
- _客户端_:咱们分手吧;
- _服务器端_:好的,让我准备一下。
- _服务器端_:我准备好了,分手吧。
- _客户端_:好的。
经过了以上流程之后,TCP 的连接就断开了。
浏览器渲染并展示结果
经过TCP交互之后,客户端也得到了服务器端返回的数据,然后使用浏览器自身的执行引擎,将最终的结果展示给用户,整个执行流程就结束了。