当前位置: 首页 > news >正文

小林coding图解计算机网络|TCP篇06|如何理解TCP面向字节流协议、为什么UDP是面向报文的协议、如何解决TCP的粘包问题?

小林coding网站通道:入口
本篇文章摘抄应付面试的重点内容,详细内容还请移步:小林coding网站通道

文章目录

  • 如何理解UDP 是面向报文的协议
  • 如何理解字节流
  • 如何解决粘包
      • 固定长度的消息
    • 特殊字符作为边界
    • 自定义消息结构

如何理解UDP 是面向报文的协议

之所以会说 TCP 是面向字节流的协议,UDP 是面向报文的协议,是因为操作系统对 TCP 和 UDP 协议的发送方的机制不同,也就是问题原因在发送方

当用户消息通过 UDP 协议传输时,操作系统不会对消息进行拆分,在组装好 UDP 头部后就交给网络层来处理,所以发出去的 UDP 报文中的数据部分就是完整的用户消息,也就是每个 UDP 报文就是一个用户消息的边界,这样接收方在接收到 UDP 报文后,读一个 UDP 报文就能读取到完整的用户消息。

你可能会问,如果收到了两个 UDP 报文,操作系统是怎么区分开的?

操作系统在收到 UDP 报文后,会将其插入到队列里,队列里的每一个元素就是一个 UDP 报文,这样当用户调用 recvfrom() 系统调用读数据的时候,就会从队列里取出一个数据,然后从内核里拷贝给用户缓冲区

在这里插入图片描述

如何理解字节流

当用户消息通过 TCP 协议传输时,消息可能会被操作系统分组成多个的 TCP 报文,也就是一个完整的用户消息被拆分成多个 TCP 报文进行传输。

这样就会导致一个问题,接收方的程序如果不知道发送方发送的消息的长度,也就是不知道消息的边界时,是无法读出一个有效的用户消息的。

下面举个例子说明。

当发送方准备发送「Hi.」和「I am Xiaolin」这两个消息。

在发送端,当我们调用 send 函数完成数据“发送”以后,数据并没有被真正从网络上发送出去,只是从应用程序拷贝到了操作系统内核协议栈中。

至于什么时候真正被发送,取决于发送窗口、拥塞窗口以及当前发送缓冲区的大小等条件。也就是说,我们不能认为每次 send 调用发送的数据,都会作为一个整体完整地消息被发送出去。如果我们考虑实际网络传输过程中的各种影响,假设发送端陆续调用 send 函数先后发送 「Hi.」和「I am Xiaolin」 报文,那么实际的发送很有可能是这几种情况。

  • 两个消息被分到同一个TCP报文「Hi.I am Xiaolin」
  • 「I am Xiaolin」的部分随 「Hi」 在一个 TCP 报文中发送出去。「Hi.I am」「Xiaolin」
  • 第三种情况,「Hi.」 的一部分随 TCP 报文被发送出去,另一部分和 「I am Xiaolin」 一起随另一个 TCP 报文发送出去,像这样。「H」「i.Iam Xiaolin」

因此,我们不能认为一个用户消息对应一个 TCP 报文,正因为这样,所以 TCP 是面向字节流的协议

两个消息的某个部分内容被分到同一个 TCP 报文时,就是我们常说的 TCP 粘包问题,这时接收方不知道消息的边界的话,是无法读出有效的消息要解决这个问题,要交给应用程序

如何解决粘包

粘包的问题出现是因为不知道一个用户消息的边界在哪,如果知道了边界在哪,接收方就可以通过边界来划分出有效的用户消息。

固定长度的消息

这种是最简单方法,即每个用户消息都是固定长度的,比如规定一个消息的长度是 64 个字节,当接收方接满 64 个字节,就认为这个内容是一个完整且有效的消息。

但是这种方式灵活性不高,实际中很少用

特殊字符作为边界

可以在两个用户消息之间插入一个特殊的字符串,这样接收方在接收数据时,读到了这个特殊字符,就把认为已经读完一个完整的消息。HTTP 是一个非常好的例子

有一点要注意,这个作为边界点的特殊字符,如果刚好消息内容里有这个特殊字符,我们要对这个字符转义,避免被接收方当作消息的边界点而解析到无效的数据

自定义消息结构

我们可以自定义一个消息结构,由包头和数据组成,其中包头包是固定大小的,而且包头里有一个字段来说明紧随其后的数据有多大。

比如这个消息结构体,首先 4 个字节大小的变量来表示数据长度,真正的数据则在后面。

struct { u_int32_t message_length; char message_data[]; 
} message;

当接收方接收到包头的大小(比如 4 个字节)后,就解析包头的内容,于是就可以知道数据的长度,然后接下来就继续读取数据,直到读满数据的长度,就可以组装成一个完整到用户消息来处理了。

相关文章:

  • 律所如何做好内容运营,提升品牌影响力
  • 数据生成 | Matlab实现基于DE差分进化算法的数据生成
  • vue + koa + Sequelize + 阿里云部署 + 宝塔:宝塔数据库连接
  • OpenCV中的模块:三维重建-SFM(1)
  • 设计模式 --5观察者模式
  • 威胁建模与网络安全测试方法
  • Android adb 常用命令
  • mysql的一些基本操作
  • Oracle 使用维进行查询重写
  • Flutter Don‘t use ‘BuildContext‘s across async gaps.
  • Jmeter各组件超详细介绍
  • Git命令(1)[删除,恢复与移动]
  • Stable Diffusion WebUI 图片信息(PNG Info)
  • H5面临的网络安全威胁和防范措施
  • 机器学习KNN最邻近分类算法
  • CSS3 聊天气泡框以及 inherit、currentColor 关键字
  • hadoop入门学习教程--DKHadoop完整安装步骤
  • java8-模拟hadoop
  • JavaScript 基本功--面试宝典
  • JWT究竟是什么呢?
  • Spring Boot快速入门(一):Hello Spring Boot
  • 理解IaaS, PaaS, SaaS等云模型 (Cloud Models)
  • 数组的操作
  • 小程序测试方案初探
  • MPAndroidChart 教程:Y轴 YAxis
  • 小白应该如何快速入门阿里云服务器,新手使用ECS的方法 ...
  • ​Z时代时尚SUV新宠:起亚赛图斯值不值得年轻人买?
  • # C++之functional库用法整理
  • (8)STL算法之替换
  • (NO.00004)iOS实现打砖块游戏(九):游戏中小球与反弹棒的碰撞
  • (附源码)python旅游推荐系统 毕业设计 250623
  • (附源码)springboot教学评价 毕业设计 641310
  • (附源码)基于ssm的模具配件账单管理系统 毕业设计 081848
  • (十) 初识 Docker file
  • (十一)c52学习之旅-动态数码管
  • (十一)手动添加用户和文件的特殊权限
  • (一)【Jmeter】JDK及Jmeter的安装部署及简单配置
  • (一)ClickHouse 中的 `MaterializedMySQL` 数据库引擎的使用方法、设置、特性和限制。
  • (一)Dubbo快速入门、介绍、使用
  • .NET 将多个程序集合并成单一程序集的 4+3 种方法
  • .NET/C# 利用 Walterlv.WeakEvents 高性能地定义和使用弱事件
  • .NET3.5下用Lambda简化跨线程访问窗体控件,避免繁复的delegate,Invoke(转)
  • .NET6 命令行启动及发布单个Exe文件
  • .NetCore项目nginx发布
  • .net和jar包windows服务部署
  • .Net环境下的缓存技术介绍
  • .NET中使用Protobuffer 实现序列化和反序列化
  • .sh 的运行
  • @private @protected @public
  • [ vulhub漏洞复现篇 ] JBOSS AS 5.x/6.x反序列化远程代码执行漏洞CVE-2017-12149
  • [【JSON2WEB】 13 基于REST2SQL 和 Amis 的 SQL 查询分析器
  • [Android] Android ActivityManager
  • [Android] 修改设备访问权限
  • [C++]类和对象【上篇】
  • [Go WebSocket] 多房间的聊天室(五)用多个小锁代替大锁,提高效率