起因:大面積機頂盒點播故障#
最怕遇到的問題就是大量用戶的隨機故障,偏偏又遇到了。一個分前端機房下屬的大量用戶報點播故障。一線報過來的故障現象又混亂,有說點不了,有說點播頁面進不了,不一而足,于是更難判斷故障。
定性:雙向網故障#
先查IPQAM,看上去都好的。報省網查VOD平臺,一如既往的石沉大海。Ping機頂盒IP有些通,有些不通,一會兒通,一會兒不通,最頭疼的隨機故障。
只好搬出FPing大招,對整個網段狂掃,數百IP只有個別地址羞羞答答的露個頭,絕大多數都不可達。再掃幾次,還是多數IP還是愛搭不理,更奇怪的是,能Ping通的IP每次都不一樣,麻煩的隨機故障。
排障:EOC貓環路#
去查網關,網關及以上路由一路暢通。網關側貌似廣播包有點大,可能是廣播風暴。于是網關往下擼,PON口,ONU,真找到一個EOC上來的廣播報文特別多。于是試著關了ONU,FPing馬上如絲般順快爽滑。打開ONU,終端馬上又吭哧吭哧出不來。蓋棺定論,罪魁禍首就是它了。
通知一線,找到用戶家,EOC貓的兩個口被一根網線環起來了。
總結:幾個隱患#
- EOC貓兩個口同VLAN
當年為了業務方便,營銷口要求這么做,技術口沒有堅持,所以留下隱患 - ONU廣播包限流效果不好
ONU都做了廣播包限流的,無奈設備就是限不住,廠家也給不出說法