1) 带宽与吞吐:上游与CDN出口峰值带宽(Gbps)、持续带宽;
2) 时延与抖动:RTT、首帧时间(TTFB)与抖动(ms)对低延迟直播影响;
3) 丢包率与重传:端到端丢包百分比(%)、重传次数与FEC支持;
4) 缓存命中率:CDN缓存HIT率(%)影响回放成本与回放延时;
5) 并发承载:单节点与全网最大并发流数、峰值并发与95分位响应时间。
1) 低时延链路:优先考察WebRTC/LL-HLS/RTMP到边缘的端到端延迟(目标<3s或<1s视业务);
2) 边缘部署密度:POP点数量与地理分布决定最后一跳延迟;
3) 码率适配与上行速率:检查CDN是否支持ABR、SRT或QUIC以降低抖动;
4) 丢帧与重连策略:评估自动重连策略、FEC与ARQ对实时稳定性的提升;
5) 监控指标实时性:是否提供实时QOE面板、RTT/丢包/首帧统计的分钟级更新。
1) 缓存分层策略:查看是否支持近源/中间缓存和冷热分离策略;
2) 吞吐成本:按回放流量计费模型与长期存储(例如S3)成本对比;
3) 启播(TTFB)与首帧时间:目标TTFB<200ms,首帧<1s为优;
4) 并发小文件请求:HEAD/GET请求QPS极限,缓存穿透保护能力;
5) 多码率切换体验:HLS/DASH切片长度(2s/4s)与Abr切换平滑度。
1) 合成负载测试:用tsduck/ffmpeg生成N路流、不同码率与分段长度;
2) 实测指标采集:采集RTT、丢包、TTFB、首帧时间与缓存命中率;
3) 地域全链路测试:北京、上海、广州、成都、香港、海外至少6点;
4) 95/99分位统计:重点看95p/99p延迟与失败率而非均值;
5) 对比表示例(示例数据用于决策参考):
| CDN | RTT(ms) | 丢包(%) | 首帧(ms) | 缓存HIT(%) | 最大并发 |
|---|---|---|---|---|---|
| CDN-A | 32 | 0.3 | 220 | 92 | 200k |
| CDN-B | 48 | 0.8 | 450 | 85 | 120k |
| CDN-C | 28 | 0.2 | 180 | 95 | 300k |
1) 清洗带宽与弹性:供应商清洗带宽上限(如>=1Tbps)和自动弹性伸缩能力;
2) 流量黑洞与白名单:支持按域名/路径精细策略,避免误杀源站流量;
3) 协议层防护:SYN cookie、速率限制、TCP复用与L7请求验证;
4) 多线路与Anycast:Anycast可在网络层分散攻击,减少单点压力;
5) 日志与告警:实时攻击流量告警、攻击回放与溯源日志保存策略。
1) 案例说明:某教育直播公司在双十一峰值并发为200,000人,平均码率1.5Mbps,总带宽约300Gbps;
2) CDN策略:主用CDN-C(缓存95%),备份CDN-A用于低时延通道,切换RTT阈值设定为80ms;
3) 源站配置示例:Origin物理服务器组——4台负载,配置如下:Intel Xeon 8C/16T 2.4GHz, 64GB RAM, 2x1TB NVMe, 上行10Gbps;
4) 边缘VPS/主机:每POP部署多台VPS做转发与缓存,单台配置示例:4核8G,带宽计费按峰值20Mbps计;
5) 运维细节:Nginx+rtmp模块做接入,HLS切片2s,启用QUIC用于低延迟回放,监控结合Prometheus与自研QOE面板。
