一、UDP/TCP

如果让你自己开发一套实时互动直播系统，在选择网络传输协议时，你会选择使用UDP协议还是TCP协议
假如使用 TCP 会怎样呢？在极端网络情况下，TCP 为了传输的可靠性，将会进行反复重发信息的操作
在 TCP 协议中，为了避免重传次数过多，定时器的超时时间会按 2 的指数增长，也就是说，假设第一次设置的超时时间是 1 秒，那么第二次就是 2 秒，第三次是 4 秒……第七次是 64 秒。如果第七次之后仍然超时，则断开 TCP 连接，而对于这么长时间的延迟，实时互动的直播系统是根本无法接受的
所以做在线直播系统时候一定要选择 UDP 协议

二、RTP 协议

在实时互动直播系统传输音视频数据流时，我们并不直接将音视频数据流交给UDP 传输，而是先给音视频数据加个 RTP 头，然后再交给 UDP 进行传输
因为视频数据在传输时，数据量太大，所以传输1帧可能需要几十个包，而数据传到接受端的时候，要将这几十个包进行组装，才能还原成完整的图像
而RTP 协议就是为了然对接端组装数据之后，顺序不会乱而存在的，你想想，如果组装的时候，顺序乱了，组装出来的图像还是传输过来的图像吗
RTP 协议非常简单，这里对RTP进行简单的介绍
sequence number：序号，用于记录包的顺序
timestamp：时间戳，同一个帧的不同分片的时间戳是相同的。不同帧的时间戳是不同的
PT：Payload Type，数据的负载类型。音频流的 PT 值与视频的 PT 值是不同的，通过它就可以知道这个包存放的是什么类型的数据
SSRC：共享媒体流的源，它是全局唯一的，不同的SSRC标识不同的共享源
CC：CSRC的个数
CSRC：共享源，一般用在混音或混屏上
X：RTP扩展头标记，如果该位置是1，说明此RTP包还有扩展头
M：表示MARK位，用来界定视频帧边界
P：填充位

本文福利，免费领取C++音视频学习资料包、技术视频/代码，内容包括（音视频开发，面试题，FFmpeg ，webRTC ，rtmp ，hls ，rtsp ，ffplay ，编解码，推拉流，srs）↓↓↓↓↓↓见下面↓↓文章底部点击免费领取↓↓

三、RTP案例

如果你在网络上接收了一组下面的音视频数据
假设 PT=80 是视频数据，PT=100 是音频数据
按照上面的规则，是不是就很容易组装数据了

{V=2,P=0,X=0,CC=0,M=0,PT:100,seq:14,ts:123456789,ssrc=888},
{V=2,P=0,X=0,CC=0,M=0,PT:80,seq:14,ts:123456789,ssrc=2345},
{V=2,P=0,X=0,CC=0,M=0,PT:100,seq:15,ts:123456789,ssrc=888},
{V=2,P=0,X=0,CC=0,M=0,PT:80,seq:15,ts:123456789,ssrc=2345},
{V=2,P=0,X=0,CC=0,M=0,PT:100,seq:16,ts:123456789,ssrc=888},
{V=2,P=0,X=0,CC=0,M=0,PT:80,seq:16,ts:123456789,ssrc=2345}