背景
办公区域是两条50M的移动光纤专线(带静态ip,和IDC那种)共100M;然后还有2条千兆电信PPOE拨号光纤。接入一台防火墙,路由是默认走电信均摊;移动专线优先级为70,平时作为备用并指定访问走专线白名单。同事批量反馈网络卡,打开网页慢。
排查1
7月初收到反馈后排查,通过策略路由指定出口确定专线没有问题,走电信2条出口,就会出现打开网页慢,DNS解析慢的情况。有问题就反馈给电信了。
电信上门的套路啊,就是上门要么拿你笔记本拨号测试或者用他的设备接光纤测试,单机测试说稳定没问题。这样的其实真的很水,浪费时间(后面会说),不过我这边的技术上门后就明里暗里说升级宽带,并发数多一点,PPOE动态拨号内网地址比如100.64.xx.xx这种的都是单条光纤并发数为4096,我2条才8k多并发, 可能不够用了。
没办法,我专线各50m的,虽然并发没限制,但是宽带共100M不够办公区用的,就让行政每条光纤各+100升级PPOE拨号动态公网ip。磕磕碰碰用了半个来月,又批量反馈卡。,这不刚升级完吗,咋还卡?
排查2
真是服了。一个办公区老说卡。看吧,三七二十一先反馈给电信,咋回事啊,刚升级的宽带又卡,流量都没泡起来。重启了光猫也一样,正常2ms的,你看下图波动都多少了,电信还是安排师傅上门检查。

电信上门,就是一个光纤拔出来接他设备单机测试说不卡不卡,没问题。其实挺无语,你这没问题,那就是我的设备问题?我这也没广播风暴啊,走专线出口ping出去稳定的一批。你单机测试我真看不出来有什么意义。
刚好电信上门是接近下班了,我一直ping着这个qq.com,结果下班后这个延迟就稳定了。稳定了!!。

上回说是并发不够才升级的宽带。这波可得好好看看并发是多少了。

根据监控自定义并发数(前文有写这个监控Zabbix监控之--防火墙会话/新建速率统计),能看到6点后并发从8-9K>到3-4K,这时延迟很稳定。
特么这到底给我并发的套餐升级没啊,这搞球,屌过去电信,这下没话说了。说给我更换下2个光猫试下,因为升级了宽带套餐,的确硬件光猫没更换。

行吧,那就等你更换吧。
周一在等下班更换光猫,上班工作时间突然一个wifi用户并发占了很大,并发给我干到累计2w去了。肯定不是防火墙性能,因为同款型号在IDC用着5W并发都没问题。

也能看到ping包多严重,直接干瘫痪了都。我去,一堆人故障找过来。

带宽一点都不高的,因为防火墙限制了各ip的带宽不超过50M,但是没限制并发数。结果飙起来了。

防火墙找到这个并发最大的终端,这个ip段在我这是分配给wifi的,果断给它禁用上网了。

禁用后没掉包了,延迟还是波动,这就还是等更换光猫吧,已经很确定了就是并发满了状态。要么电信没升级好,要么就是光猫硬件设备问题
升级拨号上网动态公网ip和光猫
更换了光猫之后再平均连接数过了8K后再看Ping值是比较均衡的,基本没过百的ms了,同上故障一个测的都是ping qq.com出来一个节点最近的2ms的,稳定应该一直在2ms左右,
说实话,也不太满意。如下图,并发稍微高那么一点,波动虽然不像没更换光猫一样那么差。但是也很闹心。

看上图,并发高一点这些就过10多ms甚至100多的400多的(较少),也不是就很稳定,毕竟按照说法升级动态公网ip后,每条光纤并发数是6W,两条能跑12W呢,而我专线不限制并发,所以木桶效应就是12W,而我这才1W并发呢,波动就来了。你说这正常??

电信我是搞不懂了。毕竟同样并发我走移动专线出去延迟一直很稳定,可没出现这波动,就将就着用吧,只能说也不咋地哈。可能人家就想你也用电信专线吧。
总结
从千兆电信PPOE光纤升级至动态公网IP和光猫后,明显能承载的并发数高了很多,但是波动也大,电信反馈是正常的那我没话说了。毕竟专线静态ip的稳定的一批,只有你流量跑满才会开始掉包延迟增大。对了,电信的光猫挺塑料的比专线的光转电差多了。光猫本质就是光转电。塑料盒子的光猫可能模块也差吧,就这样吧,大家记得这事就好,网络卡,带宽没跑满,记得看看并发数,如果你们并发数过w了,记得专线靠谱哈。