深圳鼎为网络科,一家从事华为Optix OSN3500,Optix OSN2500,Optix OSN1500设备销售的公司,致力于对超长距离及多业务数据传送网络需求的客户提供质量有保证的传输设备,本公司整机及单板型号齐全,价格合理,期待新老客户来电咨询!

你的位置:首页 > 产品资料 > 技术资料

OSN3500 SSN1SXCSA上报BUS_ERR告警

发布时间:2018-5-20 16:38:19浏览次数:资料来源:www.szdingwei.net

问题描述
某局OSN3500设备备用交叉板(10-EXCSA)上报大量BUS_ERR告警,68分钟后自动结束,业务未受影响。
级别 告警名称 监视对象 产生时间 结束时间 告警参数(16进制) 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0f 0x01 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0e 0x01 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0d 0x01 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x06 0x02 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x06 0x01 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x05 0x01 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x04 0x01 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x03 0x01 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x02 0x01 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x01 0x01 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0b 0x04 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0b 0x03 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0b 0x02 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x0b 0x01 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x08 0x04 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x08 0x03 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x08 0x02 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x08 0x01 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x07 0x02 0x06 0x02 0xff 
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x07 0x01 0x06 0x02 0xff 
告警信息
BUS_ERR



处理过程

1、该案例中的BUS_ERR告警,是软件屏蔽备用时钟板时钟频繁抖动时上报BUS_ERR的问题,存在概率性屏蔽不成功。
2、NGSDH V1R6C02B012SP04版本已经解决。R7、R8后续提供补丁版本解决。


根因
1、从告警参数看:0x0f 0x01 0x06 0x02 0xff // 表示主备交叉板握手检测到总线有OOF、B1误码告警,而且所有业务单板都上报。
2、但是所有业务板的总线都出故障的可能性不大,而且两块交叉板同时故障的可能性也不大。因此还是以前两块交叉板之间时钟同步的问题:由于主备交叉板时钟相位同步的设计问题,会导致备板时钟频繁抖动(主备板间时钟异步),进而使备板检测到业务单板过来的外部总线有FIFO溢出、B1误码、OOF、OOA告警,因此上报BUS_ERR告警。
3、为了解决这个问题,软件做了规避:当备板时钟抖动(主备间时钟异步)时,软件会做个时钟异步标志,根据这个标志,软件就不会上报总线上的FIFO溢出、B1误码、OOF、OOA告警导致的BUS_ERR告警,而只上报由总线上LOS告警导致的BUS_ERR告警。
4、然而,由于软件的这个规避方案存在缺陷,会概率性导致先检测内部总线(高阶交叉芯片至低阶交叉芯片之间的总线)后检测外部总线(高阶交叉芯片至业务单板之间的总线),这时软件会将异步标志清除,这样软件因为没有这个标志,就会将异步时外部总线上FIFO溢出、B1误码、OOF、OOA告警导致的BUS_ERR告警上报。
5、总之,备板时钟抖动时,与业务板之间的时钟不同步,是实际存在的,这样业务板送给备板的总线上也实际存在FIFO溢出、B1误码、OOF、OOA告警,但是不会影响主板的总线,因此软件上屏蔽因FIFO溢出、B1误码、OOF、OOA告警导致的BUS_ERR告警。但是由于软件屏蔽缺陷,导致备板时钟异步时,还是将FIFO溢出、B1误码、OOF、OOA告警导致的BUS_ERR告警报出来了。该问题在OSN3500、OSN7500的R6/R7/R8版本都存在。
解决方案
建议与总结


销售OSN3500 SSN1SXCSA_产品报价_销售厂家_产品特性_产品描述_深圳鼎为网络科技SDH传输设备销售有限公司
供应OSN3500 SSN1SXCSA_故障处理_安装调测_技术指标_技术参数_深圳鼎为网络科技SDH传输设备销售有限公司