两将军问题,又被称为两将军悖论、两军问题, 是一个经典的计算机思想实验。
首先, 为避免混淆,我们需要认识到两将军问题虽然与拜占庭将军问题相关,但两者不是一个东西。拜占庭将军问题是一个更通用的两将军问题版本, 通常在分布式系统故障容错、区块链中广泛讨论也会犹豫。
1.两将军问题
两支军队,驻扎在两个山头,山谷里的同一伙敌人,两将军只有同时发起进攻才能获胜,两将军约定时间的的唯一方式是派遣信使通过山谷,山谷处于敌占区。如果信使被俘获了,那么信息将会丢失。
现象一:A将军先派遣信使向 B 将军传递“晚上 10 点一起进攻”,但是 A 将军不知道信使能否穿越敌占区,由于担心自己成为唯一进攻方,A 将军可能会犹豫是否按计划进攻; 此时 B 将军收到后可以派遣信使确认收到,B的信使也可能被俘获,由于担心A没有收到确认信号而退缩,B将军也会犹豫;再次确认也不能解决,因为再次确认的新信使也可能被俘获。因此交替确认是无止尽的。
现象二:将军A派遣信使,过了很长时间未收到回复,将军A不知道是自己的信使被俘获了还是将军B的确认信使被俘获了。
我们意识到即使双方不断确认已收到对方的上一条信息,也无法确保对方已与自己达成共识。
两将军问题是无解的,目前的tcp三次握手、四次挥手都是工程解(这个一会再聊)。
2.两将军问题的头脑风暴
许多人试图解决/缓解双将军问题,提出了一些能落地的实践。
这里我们依旧假设通道的不确定性,信使只会被俘获,但是不会叛变篡改。
2.1 霰弹打鸟
如果A将军每次派遣100名信使(编号1到100),期待B将军最差也能收到一名信使的信息。
B将军根据收到的信使数量,评估这条通道的可靠性,并根据概率也派遣合适数量的确认信使。
eg: A将军派遣100信使,B将军收到10名信使的信息,B将军基本可确认这条信道可靠度为10%,B将军最少应派出10名信使(根据概率会有1名信使到达对岸)。
2.2 间歇性重试
霰弹打鸟的姿势太费信使了,但至少可帮助B将军提高信心,达成共识。
还有一种少费信使(并能提高将军信心)的策略,假设跨越山谷到达对岸并返回耗时20min, A将军可间隔20min派遣信使到对岸,直到收到对岸B将军的首次信使确认(就不再派遣)。
以上两种策略是对速度和成本的权衡,采用哪一种取决于哪一种更适合我们遇到的问题。
3. 为什么说tcp三次握手[1]是双将军问题的工程解?
知乎上有个问题: TCP 为什么是三次握手,而不是两次或四次?[2]有三个回答角度。
①TCP 为什么是三次握手,而不是两次或四次?- 朋克雪球兔的回答 - 知乎[3]
②(TCP 为什么是三次握手,而不是两次或四次?- 车小胖的回答 - 知乎[4]
③TCP 为什么是三次握手,而不是两次或四次?- wuxinliulei的回答 - 知乎[5]
希望大家仔细读一读。
首先我们要知道:
三次握手是为了在两个方向上同步(syn)序列号(seq=m),同步一次序列号需要一去一回两个包,俩方向就4个包。第2,3个包由一侧发出可以合并到一起所以最后三个包。
但是根据双将军问题,谁说一来一回两个包就能确保同步成功。
为了缓解双将军问题,tcp3次握手增加了超时重试的机制。(注意:重试只在信息同步的发起方)
第一个包:A发送给B的SYN中途丢失,没有到达B
A会周期性超时重传,直到收到B的确认。
第二个包,即是发送给A的SYN ACK 中途丢失,没有到达A
B会周期性超时重传,直到收到A的确认
第三个包:即A发送给ACK 中途丢失,没有到达B
A发完ACK,单方面认为tcp Established状态,而B显然认为tcp为Active状态。
a. 假定此时双方都没有数据发送,B会周期性超时重传,直到收到A的确认,收到之后B的TCP 连接也为 Established状态,双向可以发包。
b. 假定此时A有数据发送,B收到A的 Data ACK,自然会切换为established 状态,并接受A的 Data。
c. 假定B有数据发送,数据发送不了,会一直周期性超时重传SYN ACK,直到收到A的确认才可以发送数据。
- https://finematics.com/two-generals-problem/• https://www.bilibili.com/read/cv16604716
总结
本文记录了两将军问题: 对于不可靠信道,无数次确认都不能百分百达成可靠共识。
TCP 三次握手是在两个方向确认包的序列号, 增加了超时重试, 是两将军问题的一个工程解。
引用链接
[1] tcp三次握手: https://blog.csdn.net/weixin_35942339/article/details/112733885
[2] TCP 为什么是三次握手,而不是两次或四次?: https://www.zhihu.com/question/24853633/answer/573627478
[3] TCP 为什么是三次握手,而不是两次或四次?- 朋克雪球兔的回答 - 知乎: https://www.zhihu.com/question/24853633/answer/200721662
[4] (TCP 为什么是三次握手,而不是两次或四次?- 车小胖的回答 - 知乎: https://www.zhihu.com/question/24853633/answer/115173386
[5] TCP 为什么是三次握手,而不是两次或四次?- wuxinliulei的回答 - 知乎: https://www.zhihu.com/question/24853633/answer/63668444