1 引言
虽然家宽业务质量问题约60%发生在家庭网(见《家宽用户家庭网的主要质量问题是什么?原因有哪些》一文),但在用户的眼里,所有家宽业务质量问题都是由运营商的网络质量导致的,用户也因此对不同运营商家宽业务的质量形成了固有的印象。
从端到端的连接关系来看,运营商的家宽网络主要由宽带光纤接入网、xxNET、传送网和内容源组成,如图1所示。传送网主要提供xxNET各网元间的连接,IDC和CDN属于内容源。近几年,随着运营商对内容源引入的加大,内容源已不再是家宽网络中影响业务质量的主要方面。家宽业务的质量问题主要发生在宽带光纤接入网。
图1 家宽网络的组成
宽带光纤接入网对家宽业务质量的影响常与ODN光纤链路中断、ONU弱光、GPON接入千兆用户、OLT上联带宽受限和OLT重载有关。
2 ODN光纤链路中断
从用户对家宽业务质量投诉的原因来看,ODN光纤链路中断的占比超过70%。市政道路改造、住宅小区改造导致的光缆中断是光纤链路中断的主要原因,其次是光纤活动连接导致的链路中断。市政建设导致的光缆中断很难预防,只能在缩短抢修时限上努力了。光纤活动连接导致的链路中断往往与活动连接器的质量有关,集采使产品价格越来越便宜,但因产品质量问题导致的维护成本却越来越高。
但由于ODN光纤链路中断导致的投诉在故障修复后,用户对家宽质量的不满也随之消除,而用户使用网络时感到卡、慢才是影响用户满意度的主要方面。
3 ONU弱光
ONU弱光(ONU接收光功率小于-27dBm)会使ONU发生故障的概率明显增高,例如:弱光ONU一周内闪断5次以上的概率高达41%,是非弱光ONU的2.4倍,如图2所示(图中横坐标为ONU收光功率)。
图2 一周内闪断5次以上的ONU占比(%)
ONU弱光的主要原因是光纤的宏弯损耗过大(见《光纤弯曲半径不足对ODN链路衰耗的影响》和《常用G.657与G.652光纤的抗弯曲性能差距有多大?》一文),其次是活动连接的衰耗较大。ODN链路中活动连接的数量过多(超过8个),未使用的活动连接器未盖防尘帽(如图3所示)导致的端面污染,都会导致链路活动连接衰耗的增加。
图3 ODN中ODF单元的使用现状
弱光主要发生在ONU侧,若发生在OLT侧,则可能是因OLT采用了Class B+光模块所致(Class B+光模块的下行光功率预算比Class C+低1.5dB,但上行光功率预算比Class C+低4.0dB)。
4 GPON接入千兆用户
GPON能不能接入千兆用户的问题一直有争议。普遍认为应对GPON端口接入的千兆用户数严格控制,具体用户数各地要求不同,通常为2个~5个。但根据jsCM在2022年元宵节晚会期间针对高利用率PON口千兆用户的测速结果,如表1所示,GPON完全可满足千兆发展的需求。
表1 GPON高利用率端口千兆用户的网速测试
既有GPON端口的实际带宽利用率很低,例如某一线城市J,GPON端口下行带宽利用率峰值(秒级,一周间隔内)高于20%的占比还不足0.3%,如表2所示。千兆用户的平均网速并不会明显高于普通用户,所以,即使GPON端口下接入了多个千兆用户,单个千兆用户的测速情况都很好。
表2 某城市GPON端口下行带宽利用率峰值分布
范围 | PON口数 | 占比 |
0~10% | 98025 | 97.46% |
10%~20% | 2352 | 2.34% |
20%~30% | 125 | 0.12% |
30%~40% | 42 | 0.04% |
40%~50% | 5 | 0.00% |
50%~60% | 0 | 0.00% |
大于60% | 33 | 0.03% |
但用户的流量往往是突发的,单用户的毫秒级网速峰值总是接近于用户带宽,例如,IPTV、4K/8K等视频类业务在不同时间颗粒度下的突发速率如图4所示。千兆用户在日常使用网络时,虽然平均网速不高(通常为每秒几兆到几十兆),但毫秒级网速峰值依然会达到签约带宽的限值(签约带宽的限值一般设置为签约带宽的100%~120%)。
图4 视频类业务的突发速率(来自HW)
所以,即使GPON端口下接入的千兆用户数只有两个,只要有一个千兆用户在进行测速,同时另一个千兆用户在使用IPTV,都可能会造成毫秒级的丢包。虽然毫秒级的丢包对网络的影响有限,发生的概率也不高;但如果GPON端口接入千兆用户数较多,丢包的概率也随之增加,从而对同一PON口下其他用户的网络使用带来影响。
5 OLT上联带宽受限
当前,OLT上联电路的带宽主要为10GE(2条或4条,主备各半)。在《OLT上联电路的带宽使用率达到多少才需要扩容》一文中分析过,10GE电路扩容阈值宜为70%。
但该文只分析了秒级峰值对带宽的要求。业务在不同时间颗粒度(1ms、10ms、100ms、1s)下的峰值速率差距较大,用户带宽与用户的平均网速差距越大时,这种差距越显著。例如,单个千兆用户的毫秒级峰值可能要比秒级峰值高900Mbps以上。
OLT的缓存只有毫秒级别,当OLT上联电路的毫秒级峰值超过电路带宽时就可能会引起丢包,所以,OLT上联电路的带宽应在满足秒级峰值的基础上,根据单用户的最大带宽来做一定的冗余。10GE电路的扩容阈值若为70%,在电路利用率接近阈值时,毫秒、10毫秒、100毫秒级别的突发流量可能会丢包,因此,建议10GE电路的扩容阈值应低于60%。
现有OLT的上联中依然有少量的GE电路,当OLT下有千兆用户时,GE电路显然不适合作为OLT上联使用。而且,OLT上联的GE电路与BRAS/SR对接时,一般通过三层交换机进行汇聚,如图5所示,也会增加业务的时延。
图5 OLT与BRAS/SR的对接
6 OLT重载
通常将一台OLT接入的用户数超过5000户时称为OLT重载。OLT重载也被认为是影响家宽质量的重要原因之一,某些省市的运营商甚至要求单台OLT接入的用户数不超过1000户。
按每台OLT 16块用户板、每块用户板16个PON口、每个PON口接入64个用户计算,OLT的最大接入能力为16384户,5000户仅为设备接入能力的30.5%。如果OLT接入用户超5000户就重载了,那设备的性能一定有问题啊!
根据HW公司对OLT接入用户数与IPTV卡顿/花屏占比的分析,如表3所示,可以看出OLT接入用户数与用户体验有一定的相关性。但这种相关性也可能与OLT上联带宽受限有关,当OLT上联带宽不变时,OLT接入的用户数越多,用户的体验自然越差。
表3 OLT用户数与IPTV卡顿/花屏占比
OLT用户数 | IPTV卡顿/花屏占比 |
5000以上 | 9.17% |
4000~5000 | 8.89% |
3000~4000 | 9.06% |
2000~3000 | 8.69% |
1000~2000 | 8.48% |
OLT重载对用户上网体验的影响并不明显。基于考核的压力,为了防止单台OLT故障影响面过大,可能是对单台OLT接入用户数设限的主要原因。
7 写在最后
由于网络现状的不同,以上各因素在不同城域网中对家宽质量的影响程度也不一样。现有的PON网管对业务数据丢包的分析能力有限,上文中关于千兆用户突发流量对家宽质量影响方面的分析只是基于主观判断,网络的实际情况是怎样的,也希望得到一线运维人员的反馈。
参考文献
[1]华为. 中国移动数据承载网2022-2024年网络规划交流. 2021年
[2]华为. xx家宽体验瓶颈分析交流材料. 2022年8月
[3]中兴. 基于OLT内置DPI的宽带用户体验管理方案. 2022年8月
[4]王迎春,李昶,丁为民等. xx家宽端到端质量提升分析. 2022年8月
图/文:老丁头; 审阅:胡勇 宋兵 刘广旭
一丁一卯,专注于通信管线和宽带接入工程技术交流与分享
转载或引用请注明出处