当前位置: 首页 > news >正文

Webrtc之SDP协议

SDP简介

SDP 最常用于 RTC 实时通话的协商过程,在 WebRTC 中,通信双方在连接阶段使用 SDP 来协商后续传输过程中使用的音视频编解码器(codec)、主机候选地址、网络传输协议等。

在实际的应用过程中,通信双方可以使用 HTTP、WebSocket、DataChannel 等传输协议来相互传送 SDP 内容,这个过程称作 offer/answer 交换,也就是发起方发送 offer,接收方收到 offer 后回复一个 answer。例如在下图的服务端架构中,客户端将 offer 发送给信令服务器,信令服务器转发给媒体服务器,媒体服务器将 offer 和自身的能力进行比较后得到 answer,信令服务器再将 answer转发给客户端,随后客户端和媒体服务器就可以进行 RTP 通信。

SDP 协议的设计可以参考 rfc4566 文档。它是一种具有特殊约定格式的纯文本描述文档,也就是它的内容都是由 UTF-8 编码的文本,有点类似于 JSON/XML。一个 SDP 会话描述包括若干行 type=value 形式的文本,其中 type 是一个区分大小写的字母,例如 v、m 等,value 是一个结构化的文本,格式不固定。通常 value 由若干分割符隔开的字段组成或者是一个字符串, 整个协议文本区分大小写。"=" 两侧不允许有空格存在。

SDP 由一个会话级描述(session level description)和多个媒体级描述(media level description)组成。会话级描述的作用域是整个会话,在 SDP 中,从 "v=" 行开始到第一个 "m=" 行之前都是属于会话级描述的内容。媒体级描述对某个媒体流的内容进行描述,例如某个音频流或者某个视频流,从某个 "m=" 行开始到下个 "m=" 行之前是属于一个媒体级描述的内容。如下图所示:

 SDP 中有的字段是必须的,有的字段是可选的,可选的字段在如下的示例中都使用 * 进行标记。 SDP 中 type 出现的顺序是固定的,按照如下顺序进行排列,这样可以增强解析器错误检测的能力,另外也可以简化解析器的实现。有一个很好的网站:webrtchacks.com/sdp-anatomy… 可用于学习 SDP,这个网站里面鼠标移动到 SDP 某一行时,就会显示这一行 SDP 的具体含义。

# 1. 会话级别的描述(及其字段)
v=  (protocol version)
o=  (originator and session identifier)
s=  (session name)
i=* (session information)
u=* (URI of description)
e=* (email address)
p=* (phone number)
c=* (connection information -- not required if included in all media)
b=* (zero or more bandwidth information lines)
# 2. 一个或多个时间描述(字段参见下文)
z=* (time zone adjustments)
k=* (encryption key)
a=* (zero or more session attribute lines)
# 3. 零个或多个媒体级别的描述(字段参见下文)# 时间描述的字段有这些
t=  (time the session is active)
r=* (zero or more repeat times)# 媒体级别的描述字段有这些
m=  (media name and transport address)
i=* (media title)
c=* (connection information -- optional if included at session level)
b=* (zero or more bandwidth information lines)
k=* (encryption key)
a=* (zero or more media attribute lines)

SDP示例

// SDP 版本信息v=0// session 信息// o=<username> <session-id> <session-version> <nettype> <addrtype> <unicast-address>o=- 1873022542326151139 2 IN IP4 127.0.0.1// s=<session name>s=-// t=<start-time> <stop-time>,如果不规定开始和结束时间,两个都填 0 即可t=0 0// 使用 "a=" 来扩展的 bundle 属性,其含义是 audio 和 video 使用同一个端口发送/接收,具体可以参考下方的 RFC 文档:// https://tools.ietf.org/html/draft-ietf-mmusic-sdp-bundle-negotiation-54a=group:BUNDLE audio video// 列出当前SDP中所有的 media stream id,以空格分割// WMS 的含义是这里面的 media stream id 适配 webrtc 的 media stream// 参考 RFC 文档: https://datatracker.ietf.org/doc/html/draft-ietf-mmusic-msid-01#section-3a=msid-semantic: WMS 34b34ced3c5623ea4213vx3// m=<media> <port> <proto> <fmt> ...// port=10 无实际含义,真正通信使用的端口由 ICE Candidate 指定// proto=UDP/TLS/RTP/SAVP 表示用 UDP 来传输 RTP 包,并使用 DTLS 加密// 后面的一串数字是 fmt,表示所有 codec 的 payloadtypem=audio 10 UDP/TLS/RTP/SAVPF 111 114 115 116 123 124 125// c=<nettype> <addrtype> <connection-address>c=IN IP4 0.0.0.0// a=rtcp:<port> [nettype addrtype connection-address]a=rtcp:10 IN IP4 0.0.0.0// ICE 信息,参考 RFC 文档: https://tools.ietf.org/html/rfc5245#section-15.4a=ice-ufrag:aZ/ba=ice-pwd:3tFwvgPAA2PK3pPWoJjVz4FJa=ice-options:trickle renomination// DTLS 信息,参考 RFC 文档: https://tools.ietf.org/html/rfc4572#section-5a=fingerprint:sha-256 5F:78:37:05:D7:83:46:05:F7:3F:17:35:2A:7E:81:D3:2D:26:71:87:8B:9F:57:02:53:30:E3:3E:B6:3E:49:D5// a=setup:<role>// role可选active/passive/actpass/holdconn,// 分别表示端点将发起一个传出连接、端点将接受传入连接、// 端点愿意接受传入连接或启动传出连接、端点暂时不想建立连接// 参考 rfc: https://tools.ietf.org/html/rfc4145#section-4a=setup:actpass// a=mid:<token>// 这个 token 在 a=group 那一行中也有出现,// 也就是说这里描述的媒体正是需要被 bundle 的// 参考 rfc: https://tools.ietf.org/html/rfc5888#section-6a=mid:audio// 以下是这个媒体支持的所有 RTP 扩展头,// 参考rfc: https://tools.ietf.org/html/rfc8285// a=extmap:<value>["/"<direction>] <URI> <extensionattributes>// value=ID// direction 可选 sendonly/recvonly/sendrecv/inactive,默认值 sendrecv// URI 就是这个扩展头的 URI,通信双方可以通过 URI 标明扩展头的含义让双方都能理解// 这里表示 ID=1 的扩展头是 audio level 扩展头,表示 RTP 包中会携带音频包音量大小// 参考 https://tools.ietf.org/html/rfc6464#section-4a=extmap:1 urn:ietf:params:rtp-hdrext:ssrc-audio-level// rtp stream 信息,参考 rfc: https://tools.ietf.org/html/draft-ietf-avtext-rid-09a=extmap:13 urn:ietf:params:rtp-hdrext:sdes:rtp-stream-id// 流的方向,sendrecv 表示可以收也可以发// 参考 rfc:https://tools.ietf.org/html/rfc3264a=sendrecv// 这一行表示 rtcp 和 rtp 复用一个端口,// 参考 rfc:https://tools.ietf.org/html/rfc5761 // 和 rfc:https://tools.ietf.org/html/rfc8035a=rtcp-mux// a=rtpmap:<payload type> <encoding name>/<clock rate> [/<encoding parameters>]// opus codec 的 payload,// 表明 fmt=111 就是用来传输 opus 数据的// 参考 rfc: https://datatracker.ietf.org/doc/html/rfc7587a=rtpmap:111 opus/48000/2// a=rtcp-fb:<payload type> [...]// 表示支持的 rtcp 反馈报文类型// 这个反馈报文是 tcc 带宽探测用的// 参考 https://tools.ietf.org/html/draft-holmer-rmcat-transport-wide-cc-extensions-01a=rtcp-fb:111 transport-cc// nack,表示 fmt=111 支持 nack 重传包a=rtcp-fb:111 nack// a=fmtp 用来描述 codec 的一些特性,例如这里表示期望的 opus 最小打包时间是 10ms,并且使用 inbandfeca=fmtp:111 minptime=10;useinbandfec=1// 指明了音频 RTX 包的 payloadtype// 参考 rfc:https://tools.ietf.org/html/rfc4588#section-8.6a=rtpmap:114 rtx/48000/2// apt 表示 fmt=114 的 RTX 包是用来重传 fmt=111 音频的a=fmtp:114 apt=111// 指明了 rsfec 包的 payloadtypea=rtpmap:123 rsfec/48000/2// 指明了 red 包的 payloadtype// 参考 https://tools.ietf.org/html/rfc2198a=rtpmap:124 red/48000/2// 指明了音频 RTX 包的 payloadtypea=rtpmap:125 rtx/48000/2// apt 表示 fmt=125 的 RTX 包是用来重传 fmt=124 的 red 包的a=fmtp:125 apt=124// ssrc-group 指明了一组 ssrc 之间的关系,FID 表明后一个 ssrc 是前一个 ssrc 的 rtx// https://tools.ietf.org/html/rfc5576#section-4.2a=ssrc-group:FID 2952055605 1713037948// cname 的内容是一个 16 位 Base64 字符串,含义是传输级的标识符,同一个 PeerConnection 的值相同// 参考 https://datatracker.ietf.org/doc/html/rfc8834#section-4.9a=ssrc:2952055605 cname:vqdagKn92E0lhuXn// 这里出现了两个字符串,// 前一个是 media stream id,后一个是 sender track id// media stream 主要用于音视频同步,每个 track 以 media stream id 作为 sync label 进行同步// 参考 https://datatracker.ietf.org/doc/html/draft-ietf-mmusic-msida=ssrc:2952055605 msid:34b34ced3c5623ea4213vx3 34b34ced3c5623ea4213vx3a0// media stream ida=ssrc:2952055605 mslabel:34b34ced3c5623ea4213vx3// sender track ida=ssrc:2952055605 label:34b34ced3c5623ea4213vx3a0// video mediam=video 10 UDP/TLS/RTP/SAVPF 96 97 101 102 103c=IN IP4 0.0.0.0a=rtcp:10 IN IP4 0.0.0.0a=ice-ufrag:aZ/ba=ice-pwd:3tFwvgPAA2PK3pPWoJjVz4FJa=ice-options:trickle renominationa=fingerprint:sha-256 5F:78:37:05:D7:83:46:05:F7:3F:17:35:2A:7E:81:D3:2D:26:71:87:8B:9F:57:02:53:30:E3:3E:B6:3E:49:D5a=setup:actpassa=mid:video// 传输时间偏移扩展头// 参考 https://datatracker.ietf.org/doc/html/rfc5450a=extmap:2 urn:ietf:params:rtp-hdrext:toffset// abs-send-time 扩展头,gcc 带宽探测用的a=extmap:3 http://www.webrtc.org/experiments/rtp-hdrext/abs-send-time// 视频朝向扩展头// 参考 https://datatracker.ietf.org/doc/html/rfc6184a=extmap:4 urn:3gpp:video-orientation// transport-cc 扩展头,tcc 带宽探测用的a=extmap:5 http://www.ietf.org/id/draft-holmer-rmcat-transport-wide-cc-extensions-01// 扩展头的内容是对播放延迟限制的值a=extmap:6 http://www.webrtc.org/experiments/rtp-hdrext/playout-delay// 视频内容类型扩展头a=extmap:7 http://www.webrtc.org/experiments/rtp-hdrext/video-content-type// 这个扩展头用于传输每帧的时间信息a=extmap:8 http://www.webrtc.org/experiments/rtp-hdrext/video-timing// 视频的色域空间扩展头a=extmap:12 http://www.webrtc.org/experiments/rtp-hdrext/color-space// 传输视频 SDES 信息的扩展头// 参考:https://datatracker.ietf.org/doc/html/draft-ietf-avtext-rid-06a=extmap:13 urn:ietf:params:rtp-hdrext:sdes:rtp-stream-ida=sendrecva=rtcp-mux// 支持 rtcp 压缩// 参考 https://datatracker.ietf.org/doc/html/rfc5506#section-1a=rtcp-rsize// 指明 fmt=96 就是用来传输 H264 编码的视频的a=rtpmap:96 H264/90000// remb 反馈报文,gcc 带宽探测用的a=rtcp-fb:96 goog-remba=rtcp-fb:96 transport-cc// FIR(完整帧内请求)反馈报文// 参考 https://datatracker.ietf.org/doc/html/rfc5104a=rtcp-fb:96 ccm fira=rtcp-fb:96 nack// PLI NACK 反馈报文// 参考 https://datatracker.ietf.org/doc/html/rfc5104a=rtcp-fb:96 nack pli// 后面的是一些 H264 的参数a=fmtp:96 level-asymmetry-allowed=1;packetization-mode=1;profile-level-id=42e01fa=rtpmap:97 rtx/90000a=fmtp:97 apt=96;packetization-mode=1a=rtpmap:101 red/90000a=fmtp:101 packetization-mode=1a=rtpmap:102 rtx/90000a=fmtp:102 apt=101;packetization-mode=1a=rtpmap:103 rsfec/90000a=fmtp:103 packetization-mode=1// ssrc-group:SIM 表示后面的这些 ssrc 是同一个流的 simulcasta=ssrc-group:SIM 2955842370 1032318052a=ssrc-group:FID 2955842370 521905126a=ssrc-group:FID 1032318052 1492521545a=ssrc:2955842370 cname:vqdagKn92E0lhuXna=ssrc:2955842370 msid:34b34ced3c5623ea4213vx3 34b34ced3c5623ea4213vx3v0a=ssrc:2955842370 mslabel:34b34ced3c5623ea4213vx3a=ssrc:2955842370 label:34b34ced3c5623ea4213vx3v0a=ssrc:1032318052 cname:vqdagKn92E0lhuXna=ssrc:1032318052 msid:34b34ced3c5623ea4213vx3 34b34ced3c5623ea4213vx3a=ssrc:1032318052 mslabel:34b34ced3c5623ea4213vx3a=ssrc:1032318052 label:34b34ced3c5623ea4213vx3v0a=ssrc:521905126 cname:vqdagKn92E0lhuXna=ssrc:521905126 msid:34b34ced3c5623ea4213vx3 34b34ced3c5623ea4213vx3v0a=ssrc:521905126 mslabel:34b34ced3c5623ea4213vx3a=ssrc:521905126 label:34b34ced3c5623ea4213vx3v0a=ssrc:1492521545 cname:vqdagKn92E0lhuXna=ssrc:1492521545 msid:34b34ced3c5623ea4213vx3 34b34ced3c5623ea4213vx3v0a=ssrc:1492521545 mslabel:34b34ced3c5623ea4213vx3a=ssrc:1492521545 label:34b34ced3c5623ea4213vx3v0// 使用的 rsfec 的版本a=rsfec-version:1

参考文档

  • SDP 格式规定,RFC4566:datatracker.ietf.org/doc/html/rf…
  • offer/answer 交换过程,RFC3264:datatracker.ietf.org/doc/html/rf…
  • SDP 各字段解释示例:webrtchacks.com/sdp-anatomy…
  • segmentfault.com/a/119000003…

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 20221元组
  • 在阿里云上部署 Docker并通过 Docker 安装 Dify
  • Linux (Ubuntu) conda:未找到命令报错处理
  • 大模型预训练与微调之间的关系
  • css渐变边框的两种方案
  • Sql Server 触发器中的临时表
  • LeetCode.22。括号生成
  • C++观察者模式:订阅博主~
  • 2024-08-05升级问题:Android中ScrollView嵌套listview并解决listview显示问题
  • 在Ubuntu 16.04上安装Jenkins的方法
  • 第N8周:使用Word2vec实现文本分类
  • [000-01-018].第3节:Linux环境下ElasticSearch环境搭建
  • C语言:for、while、do-while循环语句
  • Android系统架构
  • Spring 声明式事务 @Transactional
  • 【译】JS基础算法脚本:字符串结尾
  • 《微软的软件测试之道》成书始末、出版宣告、补充致谢名单及相关信息
  • 【笔记】你不知道的JS读书笔记——Promise
  • classpath对获取配置文件的影响
  • JavaWeb(学习笔记二)
  • java小心机(3)| 浅析finalize()
  • jquery ajax学习笔记
  • js 实现textarea输入字数提示
  • Synchronized 关键字使用、底层原理、JDK1.6 之后的底层优化以及 和ReenTrantLock 的对比...
  • webpack项目中使用grunt监听文件变动自动打包编译
  • 多线程 start 和 run 方法到底有什么区别?
  • 模仿 Go Sort 排序接口实现的自定义排序
  • 前端面试题总结
  • 使用 @font-face
  • 东超科技获得千万级Pre-A轮融资,投资方为中科创星 ...
  • 移动端高清、多屏适配方案
  • ​​​​​​​GitLab 之 GitLab-Runner 安装,配置与问题汇总
  • ‌前端列表展示1000条大量数据时,后端通常需要进行一定的处理。‌
  • $().each和$.each的区别
  • (ISPRS,2021)具有遥感知识图谱的鲁棒深度对齐网络用于零样本和广义零样本遥感图像场景分类
  • (笔试题)合法字符串
  • (第8天)保姆级 PL/SQL Developer 安装与配置
  • (回溯) LeetCode 46. 全排列
  • (三) prometheus + grafana + alertmanager 配置Redis监控
  • (五)网络优化与超参数选择--九五小庞
  • (一)Linux+Windows下安装ffmpeg
  • (转)创业的注意事项
  • .NET CF命令行调试器MDbg入门(一)
  • .net core 3.0 linux,.NET Core 3.0 的新增功能
  • .NET Core使用NPOI导出复杂,美观的Excel详解
  • .NET gRPC 和RESTful简单对比
  • .NET 快速重构概要1
  • .net遍历html中全部的中文,ASP.NET中遍历页面的所有button控件
  • .NET国产化改造探索(一)、VMware安装银河麒麟
  • .NET面试题解析(11)-SQL语言基础及数据库基本原理
  • @Autowired @Resource @Qualifier的区别
  • @ComponentScan比较
  • @SentinelResource详解
  • [ 常用工具篇 ] AntSword 蚁剑安装及使用详解
  • [\u4e00-\u9fa5] //匹配中文字符