番羽土啬口巴: SSL/TLS的原理以及互联网究竟是如何工作的（8） —

我：都一个多月没来这里了呢，这次去拜访一下谁呢……

TCP&UDP：啊，幽灵来了啊！你都很久没来了啊，最近很忙是吗？

我：最近事情是比较多……你们两位是？

TCP：我是传输层的TCP（Transmission Control Protocol，传输控制协议）！旁观这位是同样大名鼎鼎的UDP（User Datagram Protocol，用户数据报协议），你应该都听说过吧？

我：那是自然。你是面向连接的协议，而UDP是无连接的协议；你是可靠的，而UDP是不可靠的；你们的上层协议就是那些应用层协议，你们是应用程序进程和操作系统之间的桥梁……

TCP：不错啊，幽灵，我记得一开始你来这里的时候还什么都不知道呢，结果闹了不少笑话。看来真是“士别三日，应当刮目相看”呢（笑）。不过……你知道为什么吗？

我：什么为什么？

TCP：我是说，你知道为什么我要通过三路握手建立连接呢？为什么我和UDP是应用程序进程和操作系统之间的桥梁呢？为什么我释放连接的时候也要进行三路握手呢（不过也可以通过RST直接单方面释放连接）？

我：……这还真不知道。

TCP：那我还是从头开始说吧。传输层的定位在网络层和应用层之间。网络层及以下层都是对用户隐藏的（用户无法直接与之交互），而且独立于应用程序进程工作；而应用层则是直接面对用户的，应用层协议都是配合对应的具体应用程序进程进行工作的，例如HTTP协议配合浏览器进程，XMPP协议配合IRC（Internet Relay Chat）进程，SMTP配合邮件客户端进程。工作在传输层的软件或硬件被称作transport entity（传输实体），负责实现进程间通信。

而我所在的传输层，一方面不受具体应用程序的制约，另一方面又能和用户直接交互外加对用户屏蔽下层工作细节，从而实现远程进程之间的端到端通信。要做到这一切，就必须处在应用程序进程和操作系统之间。

对了，说到进程之间的端到端通信，这里要引入一个重要概念：SAP（Service Access Point，服务访问点）。要在两个远程进程间建立连接，就必须要设置SAP。传输层的SAP是端口，被称作TSAP（Transport Service Access Point，传输服务访问点）；而网络层的SAP是IP地址，被称作NSAP（Network Service Access Point，网络服务访问点）。IP地址只能定位到主机，加上端口之后才能定位到进程，进而实现端到端通信。

然后呢，网络编程中的一个重要人物就要出场了！

Socket：现在是我的专场！我叫socket（套接字），专门负责进程之间的远程通信，程序员们最熟悉我了（笑）。不管是建立连接还是维持连接还是释放连接，都需要我出马才行啊：服务器通过LISTEN开始被动监听，准备建立连接；客户端发出CONNECT命令，主动要求建立连接；服务器接收到命令之后就ACCEPT，连接建立了！然后呢，客户端发送RECEIVE命令，要求收到指定的数据；服务器收到之后就SENT，把指定数据发送出去；最后，服务器和客户端都发送CLOSE命令，释放连接。

这些命令都是通过socket实现的，而且所有的socket都引用了前面提到的SAP以访问对应的进程。

我：快头晕了……

TCP：别急，下面就开始说有意思的事了。你有没有想过，三路握手其实很麻烦啊？为什么不能直接就建立连接呢？比如说直接发送连接建立请求和数据过去，然后马上就处理好了，干嘛还要对方确认再正式建立连接呢？

我：是为了保证可靠吧……具体我也不清楚

TCP：并不是为了保证可靠。可靠的含义是：1，先发送的先到达；2，出现丢包和损坏等数据没被正常送到的情况时，保证重传。

第一点是通过建立虚电路实现的，一个连接只有一条路由路径；而要实现第二点也很简单，一方传输数据和连接请求过去之后要求对方发送确认信息即可。

可是，还有一个很严重的问题没有解决：假设一个客户端给服务器发送了带着数据的连接请求，但是却因为网络拥塞而超时了；那么此时客户端会重新发送之前的请求，这次没有超时，成功建立了连接。

问题在于，一段时间之后最开始的那个请求也到达了，结果就是服务器没法识别出这是雷同请求，然后又建立连接了！

我：这会造成什么严重后果吗？

TCP：会造成极为严重的后果！想象一下这样一个场景：客户端向银行服务器发送请求，要求向一个账户转入一万美元；结果发生了前面所说的状况，那么最终结果就是转入了两万美元，但客户端却一无所知！

我：这听起来真够糟糕的。不过，可以给每个连接都加上独一无二的序列号啊？

TCP：听起来不错，问题在于……服务器出于性能上的考虑，并不会专门建立一个序列号数据库来记住那些连接的不同序列号的。

我：（汗）那就只能先不发送数据，只发送连接建立请求，然后服务器发送确认信息，客户端再发送数据；这样一来，后来雷同请求来了之后，服务器端就会先问客户端是不是真的想要建立连接，然后客户端就会发现异常从而拒绝了。

TCP：没错，就是这样！这一过程就是我的三路握手（three-way handshake）！当然实现的时候就没这么简单了，但基本思路就是这样的！

我：哈哈，被我猜对了啊！

TCP：接下来该说说怎样释放连接了。如果对方主机长时间无响应或者断网了抑或是出现了其他异常状况，另一方就会直接发送RST包单方面释放连接。

但是在正常情况下，当通信完成时，我并不会单方面释放连接的。

我：为什么呢？

TCP：想象一下，一个客户端发送了最后一个请求，然后服务器响应之后就单方面释放连接了，可是响应数据包丢失了。那么，客户端就会请求重传，但此时服务器已经释放了连接，不会再理会客户端了。

我：那么这数据就永远丢失了！

TCP：是啊。不过呢，释放连接比建立连接要难弄的多了。我先说一个故事吧：有一个山谷，山谷里驻扎着一只三人军队，叫A队；两边的山顶上分别驻扎着B队的两个分队，每个分队各两人。B队想要消灭A队，但是如果分队单独行动，那么一定会输的。

我：那就想办法同时行动啊。

TCP：这是自然。问题在于，B队的两个分队要想取得联系，只能派斥候（斥候没有战斗力，不算分队成员）走过山谷去通知对方。而斥候是有可能被抓的，也就是说不保证消息能送到。在无法确定对方是否收到消息的情况下，不管哪个分队都不会行动的。

我：那么，在分队1的斥候到达分队2把消息带来之后，分队2再派斥候把确认消息带过去就行了啊？

TCP：真的吗？带确认消息的斥候也是有可能被抓的！如果说斥候被抓了，那还不是没法确定对方是否收到消息？

我：那就再派斥候把确认消息收到的确认消息传回去（这话说起来怎么这么绕口）……

TCP：还是不行啊！确认消息的确认消息还是有可能送不到啊。最关键的一点在于，最后一个斥候是否到达是无法被确认的；那么送出最后一个斥候的分队就会犹豫对方是不是收到了确认信息，会不会同时攻击A队。一旦这么犹豫了，分队就不会参加攻击行动，那么也就无法战胜A队了。

现在，试着把斥候换成计算机网络中的不可靠通信信道，把攻击命令换成连接释放命令吧。

我：这么说实际上根本就做不到一起释放连接了？

TCP：不，实际情况反倒好办很多：还是拿前面的例子，在完成最后一次数据传递后，客户端发送FIN包，服务器端接收到之后发送FIN+ACK包，同时释放连接；客户端接收到ACK包或者长时间接收不到响应，都会释放连接。

我：相当于不管不顾了。不过既然本来就是个无解的问题，那也只能这么办了。

TCP：啊，这次扯了太多了，对不起，UDP你只能下次再出场了。

UDP：好吧，T！C！P！

科普文链接集合：

http://ift.tt/1G8ShFs

原文：http://ift.tt/1ELg4cy

via 细节的力量 http://ift.tt/1bEppto

番羽土啬口巴

Saturday, March 28, 2015

SSL/TLS的原理以及互联网究竟是如何工作的（8） ——奇妙的传输层！

No comments:

Post a Comment