概述
运输层向上层的应用层提供通信服务,但实际上通信的两端不是主机而是主机中的应用进程。运输层屏蔽了下面层的细节,它使应用程序看起来像是在两个传输层实体之间有一条端到端的逻辑通信信道
运输层需要两种不同的运输协议,面向连接的TCP和无连接的UDP,TCP提供的是可靠的双全工的可靠信道,UDP无论下层如何,提供的仍然是不可靠信道
应用层和运输层之间设定了一个协议端口作为通信的终点,这些端口用来标记客户端进程从而进行通信
用户数据报协议UDP
特点
UDP无连接,且尽最大努力交付(不可靠),面向报文(不拆分也不合并,只添加UDP首部),没有拥塞控制,支持一对一、一对多、多对一和多对多通信,而且首部开销小
UDP的首部格式
首部字段只有8个字节,由4个字段组成(每个字段长度都是2字节):源端口、目的端口、长度、检验和
伪首部是为了在计算检验和时得到一个临时的UDP用户数据报
传输控制协议TCP
特点
TCP是面向连接的运输层协议,提供可靠交付,有流量控制,拥塞控制,每一条TCP连接只能是点对点的全双工通信,面向字节流(把应用层传下来的报文看成字节流,把字节流组织成大小不等的数据块),其连接的端点叫套接字(IP地址:端口号)
可靠传输工作原理
A作为发送分,B作为接收方,A每发送一次分组就要等待对方的确认,收到确认后才能再发送下一个分组
当出现差错时,TCP 使用超时重传:如果一个已经发送的报文段在超时时间内没有收到确认,那么就重传这个报文段。一个报文段从发送再到接收到确认所经过的时间称为往返时间 RTT,RRTs为加权平均往返时延,这个超时时间应该略大于RRTs,并且A在发送时必须暂时保留已发送的分组的副本来保证可以重传
当A没有收到B的确认时,重传报文时,B需要丢弃这个报文段,并向A发送确认
通过确认和重传机制,TCP就可以在不可靠传输网络上实现可靠的通信
TCP报文段的首部格式
- 源端口和目的端口:通信双方的端口,各占两字节
- 序号:用于给字节流中的每一个字节按顺序编号,例如序号为 301,表示第一个字节的编号为 301,如果携带的数据长度为 100 字节,那么下一个报文段的序号应为 401,占4字节
- 确认号:期望收到的下一个报文段的第一个数据字节的序号,例如 B 正确收到 A 发送来的一个报文段,序号为 501,携带的数据长度为 200 字节,因此 B 期望下一个报文段的序号为 701,B 发送给 A 的确认报文段中确认号就为 701
- 数据偏移:指的是数据部分距离报文段起始处的偏移量,实际上指的是首部的长度
- 保留:没有意义
- 紧急URG:代表此报文中有紧急字段,需要尽快传输
- 确认ACK:当 ACK=1 时确认号字段有效,否则无效。TCP 规定,在连接建立后所有传送的报文段都必须把 ACK 置 1
- 推送PSH:尽快的交付应用进程而不等待缓存填满再向上交付
- 复位RST:重建连接
- 同步SYN:在连接建立时用来同步序号。当 SYN=1,ACK=0 时表示这是一个连接请求报文段。若对方同意建立连接,则响应报文中 SYN=1,ACK=1
- 终止FIN:用来释放一个连接,当 FIN=1 时,表示此报文段的发送方的数据已发送完毕,并要求释放连接
- 窗口:窗口值作为接收方让发送方设置其发送窗口的依据。之所以要有这个限制,是因为接收方的数据缓存空间是有限的
TCP可靠传输实现
滑动窗口
TCP的滑动窗口以字节为单位,作为缓存的一部分用来暂时存放字节流。接收方通过 TCP 报文段中的窗口字段告诉发送方自己的窗口大小,发送方根据这个值和其它信息设置自己的窗口大小
发送窗口内的字节都允许被发送,接收窗口内的字节都允许被接收。如果发送窗口左部的字节已经发送并且收到了确认,那么就将发送窗口向右滑动一定距离,直到左部第一个字节不是已发送并且已确认的状态;接收窗口的滑动类似,接收窗口左部字节已经发送确认并交付主机,就向右滑动接收窗口
接收窗口只会对窗口内最后一个按序到达的字节进行确认,例如接收窗口已经收到的字节为 {31, 34, 35},其中 {31} 按序到达,而 {34, 35} 就不是,因此只对字节 31 进行确认。发送方得到一个字节的确认之后,就知道这个字节之前的所有字节都已经被接收
超时重传时间选择
TCP采用自适应算法来选择重传时间,首先记录报文往返时间RTT,然后求得RTTs(加权平均往返时间),每测量一个新的RTT样本,就按下列公式重新计算RTTs:
其中,0 ≤ a < 1,RTTs 随着 a 的增加更容易受到 RTT 的影响。
超时时间 RTO 应该略大于 RTTs,TCP 使用的超时时间计算如下:
RTTd为偏差的加权平均值,并且只要报文段重传了就不采用其往返时间的样本,这样得出的RTTs和RTO就较为准确
选择确认
当TCP的接收方收到的字节流序号不连续时,就需要通知对方缺失的部分。例如当序号1~1000收到了,但序号1001~1500没收到,1501~2000又收到了,如果这些序号都在接收窗口内,那接收方就先收下这些数据,但要将这些数据准确告诉发送分,使发送方不再重复发送这些数据
TCP流量控制
流量控制就是让发送方的发送速率不要太快,要让接收方来得及接受
接收方在建立连接时会通知发送方接收窗口大小,并且在每一次的确认报文中也会通知,从而控制发送窗口大小实现流量控制
当接收窗口为0后,发送方会停止发送,但是会启动持续计时器,若时间到期了,就发送一个零窗口探测报文段(仅携带1字节的数据),对方在确认这个探测报文段时给出了现在的窗口值,若仍为0则重新设置持续计数器,若不为0则恢复数据传送
可以用不同的机制来控制TCP报文段的发送时机。如:
- TCP维持一个变量,它等于最大报文段长度MSS。只要缓存中存放的数据达到MSS字节时,就组装一个TCP报文段发送出去;
- 由发送方的应用进程指明要求发送报文段,即TCP支持的推送操作
- 发送方的一个计时器期限到了,这时就把已有的缓存数据装入报文段(但长度不能超过MSS)发送出去
Nagle算法:若发送应用进程把要发送的数据逐个字节地送到TCP的发送缓存,则发送方就把第一个数据字节发送出去,把后面到达的数据字节都缓存起来。当发送方接收对第一个数据字符的确认后,再把发送缓存中的所有数据组装成一个报文段再发送出去,同时继续对随后到达的数据进行缓存。只有在收到对前一个报文段的确认后,才继续发送下一个报文段。当数据到达较快而网络速率较慢时,用这样的方法可明显地减少所用的网络带宽。Nagle算法还规定:当到达的数据已达到发送窗口大小的一半或已经达到报文段的最大长度时,就立即发送一个报文段。
糊涂窗口综合证:TCP接收方的缓存已满,而交互式的应用进程一次只从接收缓存中读取1字节(这样就使接收缓存空间仅腾出1字节),然后向发送方发送确认,并把窗口设置为1个字节(但发送的数据报为40字节的的话)。接收,发送方又发来1个字节的数据(发送方的IP数据报是41字节)。接收方发回确认,仍然将窗口设置为1个字节。这样,网络的效率很低。要解决这个问题,可让接收方等待一段时间,使得或者接收缓存已有足够空间容纳一个最长的报文段,或者等到接收方缓存已有一半空闲的空间。只要出现这两种情况,接收方就发回确认报文,并向发送方通知当前的窗口大小。此外,发送方也不要发送太小的报文段,而是把数据报积累成足够大的报文段,或达到接收方缓存的空间的一半大小
TCP拥塞控制
如果网络出现拥塞,分组将会丢失,此时发送方会继续重传,从而导致网络拥塞程度更高。因此当出现拥塞时,应当控制发送方的速率。这一点和流量控制很像,但是出发点不同。流量控制是为了让接收方能来得及接收,而拥塞控制是为了降低整个网络的拥塞程度
CP 主要通过四个算法来进行拥塞控制:慢开始、拥塞避免、快重传、快恢复。
发送方需要维护一个叫做拥塞窗口(cwnd)的状态变量,注意拥塞窗口与发送方窗口的区别:拥塞窗口只是一个状态变量,实际决定发送方能发送多少数据的是发送方窗口
为了便于讨论,做如下假设:
- 接收方有足够大的接收缓存,因此不会发生流量控制
- 虽然 TCP 的窗口基于字节,但是这里设窗口的大小单位为报文段
慢开始与拥塞避免
发送的最初执行慢开始,令 cwnd = 1,发送方只能发送 1 个报文段;当收到确认后,将 cwnd 加倍,因此之后发送方能够发送的报文段数量为:2、4、8 ...
注意到慢开始每个轮次都将 cwnd 加倍,这样会让 cwnd 增长速度非常快,从而使得发送方发送的速度增长速度过快,网络拥塞的可能性也就更高。设置一个慢开始门限 ssthresh,当 cwnd >= ssthresh 时,进入拥塞避免,每个轮次只将 cwnd 加 1。
如果出现了超时,则令 ssthresh = cwnd / 2,然后重新执行慢开始
快重传与快恢复
在接收方,要求每次接收到报文段都应该对最后一个已收到的有序报文段进行确认。例如已经接收到 M1 和 M2,此时收到 M4,应当发送对 M2 的确认
在发送方,如果收到三个重复确认,那么可以知道下一个报文段丢失,此时执行快重传,立即重传下一个报文段。例如收到三个 M2,则 M3丢失,立即重传 M3
在这种情况下,只是丢失个别报文段,而不是网络拥塞。因此执行快恢复,令 ssthresh = cwnd / 2 ,cwnd = ssthresh,注意到此时直接进入拥塞避免
慢开始和快恢复的快慢指的是 cwnd 的设定值,而不是 cwnd 的增长速率。慢开始 cwnd 设定为 1,而快恢复 cwnd 设定为 ssthresh
主动队列管理AQM
路由器的尾部丢弃策略会导致TCP进入慢开始状态,会影响同一个网络里的多个TCP连接从而在同一时间进入的慢开始状态(全局同步),所以路由器使用AQM,在队列长度到达某个警惕值时就主动丢弃到达的分组,提醒发送方放慢发送速率,减轻网络拥塞,甚至不出现网络拥塞
TCP连接建立
假设 A 为客户端,B 为服务器端。
- 首先 B 处于 LISTEN(监听)状态,等待客户的连接请求
- A 向 B 发送连接请求报文,SYN=1,ACK=0,选择一个初始的序号 x
- B 收到连接请求报文,如果同意建立连接,则向 A 发送连接确认报文,SYN=1,ACK=1,确认号为 x+1,同时也选择一个初始的序号 y
- A 收到 B 的连接确认报文后,还要向 B 发出确认,确认号为 y+1,序号为 x+1
- B 收到 A 的确认后,连接建立
三次握手的原因
第三次握手是为了防止失效的连接请求到达服务器,让服务器错误打开连接
客户端发送的连接请求如果在网络中滞留,那么就会隔很长一段时间才能收到服务器端发回的连接确认。客户端等待一个超时重传时间之后,就会重新请求连接。但是这个滞留的连接请求最后还是会到达服务器,如果不进行三次握手,那么服务器就会打开两个连接。如果有第三次握手,客户端会忽略服务器之后发送的对滞留连接请求的连接确认,不进行第三次握手,因此就不会再次打开连接
四次握手
可以将B发送给A的报文段拆成两个,一个确认报文段(ACK = 1,ack = x + 1),然后再发送一个同步报文段(SYN = 1,seq = y)这样就是四次握手,但从实际效率来看没有意义
TCP连接释放
- A 发送连接释放报文,FIN=1,seq = u,u等于前面已经传送过的数据的最后一个字节的序号+1
- B 收到之后发出确认,此时 TCP 属于半关闭状态,B 能向 A 发送数据但是 A 不能向 B 发送数据,确认号为 u+1,此时开始ACK一直为1,seq = v(同上)
- 当 B 不再需要连接时,发送连接释放报文,FIN=1
- A 收到后发出确认,进入 TIME-WAIT 状态,等待 2 MSL(最大报文存活时间)后释放连接
- B 收到 A 的确认后释放连接
四次挥手的原因
客户端发送了 FIN 连接释放报文之后,服务器收到了这个报文,就进入了 CLOSE-WAIT 状态。这个状态是为了让服务器端发送还未传送完毕的数据,传送完毕之后,服务器会发送 FIN 连接释放报文
TIME_WAIT
客户端接收到服务器端的 FIN 报文后进入此状态,此时并不是直接进入 CLOSED 状态,还需要等待一个时间计时器设置的时间 2MSL。这么做有两个理由:
- 确保最后一个确认报文能够到达。如果 B 没收到 A 发送来的确认报文,那么就会重新发送连接释放请求报文,A 等待一段时间就是为了处理这种情况的发生
- 等待一段时间是为了让本连接持续时间内所产生的所有报文都从网络中消失,使得下一个新的连接不会出现旧的连接请求报文