金鷗是集團上海NOC網絡監控室傳輸核心崗位的員工,因主要負責電信集團傳輸國內、國際骨干網絡的技術支撐等工作,他工作履歷都是“干大事”。除了常規的骨干網維護工作外,牽涉無數重要國際政企客戶的海光纜保障,也是他的主要工作。金鷗的肩上壓著的是中國電信的品牌形象,工作稍有不慎,砸的是電信的金字招牌。這種壓力像是不透風的墻,像是達摩克利斯頭上那柄劍,不過,談及此,80后的金鷗心態老成,一臉都是淡定從容,“既然認準了一條路,何必打聽要走多久,無問西東,心態就好。”
世界杯期間7×24小時待命
6月14日開始,全民進入世界杯看球賽直播的狂歡當中。不過,這場聲勢浩大、收視率超高的體育賽事,對金鷗來說,是一場艱巨的考驗,央視直播線路的重點保障,橫跨亞歐大陸,距離長達2萬多公里,牽涉3家運營商。賽事期間,依靠前期充分的保障預案以及7×24小時不間斷支撐,金鷗做到了長達一個月直播期間央視未出一起直播事故。
記者:世界杯直播保障、海光纜維護、阿里巴巴等重點客戶保障,你身上的擔子很重。這三個保障,哪一個壓力最大?
金鷗:世界杯直播保障壓力最大,畢竟全中國球迷都看著呢。不過,壓力雖大,心里還是很有底氣,不僅是團隊支撐強,更重要的是我們前期預案做得很充分。
記者:充分到什么程度?
金鷗:當時央視租用了3條專線,預案包括3條重保業務的故障監控模板、中斷對用戶業務影響分析、重路由段落的風險分析以及不同情況的緊急恢復預案等。舉個小例子,光預案中建立的重保電路網管監控模板就涉及超過100個端口。
記者:直播期間的壓力大嗎?
金鷗:壓力肯定有。在保障期間,我7×24小時待命,而且賽事期間一般都是下班后,我還保證家里電腦也隨時處于待機狀態,保證能隨時遠程支撐,保證直播期間業務處于三保險狀態,一旦有一路線路出現問題及時得到處理。
一封來自阿里巴巴的感謝信
金鷗還是傳輸國際海纜恢復團隊的負責人。由于海纜故障會導致重要國際政企客戶以及互聯網帶寬受影響,所以在重大海纜故障發生后,他需在第一時間協同各部門,最快時間完成涉及國際骨干網絡業務的恢復。
今年5月AAG海纜中斷及FASTER海纜維護期間,阿里巴巴連接亞太到美洲的骨干電路受到影響。金鷗通過和電信各相關部門的不懈溝通及協作,艱難地臨時調度通了一條香港至美西的100G鏈路業務,保證阿里巴巴業務的穩定運行。了解到調度資源來之不易之后,阿里巴巴不甚感激,寄來一封表揚信,點名稱贊金鷗等人付出的努力。
記者:相較于直播這一類可以有充分預案的保障,海光纜這類突發性保障更考驗人的綜合素質能力。這類故障的處理的難點在哪里?
金鷗:由于海光纜采用運營商俱樂部形式建設和管理,許多段落非電信負責,而且海中修理光纜受修纜船只調配、海上天氣等不可控因素影響,同時由于海纜容易受捕魚船只破壞,近年故障高發。對于這類故障的工作思路就是:盡快、盡量、盡力,以恢復業務優先,在有限的出口資源的情況下,盡可能調配和安排恢復資源。
記者:阿里巴巴資源調度艱難之處在什么地方?
金鷗:在于阿里巴巴的業務是跨境的100G帶寬業務。跨境100G業務帶寬對電信來說非常緊張,當時我和國際公司同事對100G資源進行了梳理,在確認無空閑資源的情況下,溝通了幾套用其他類型資源的替代恢復方案,但是都被驗證不可行,最后經過和集團數據專業相關人員溝通協調,確定了一條對電信數據網絡影響較小的100G數據鏈路的通道,臨時借用給阿里巴巴,最終在規定時間內完成了恢復方案的制定和執行。
記者:那收到阿里巴巴感謝信后,第一感受是什么?
金鷗:網絡維護對于客戶來說可以說是一種隱形的存在,其實很多時候我們希望客戶不知道有我們的存在,因為客戶的完美體驗就是感知不到電信網絡的波動和故障。在接到阿里巴巴的感謝信后的第一感受是對自己工作重要性和必要性的認可,因為隱形時間長了,難免會減少自己的存在感,而通過感謝信進一步加深了我對我工作價值的認可,十分開心。
漂亮指標背后的“方法論”
金鷗還負責維護中國電信的骨干網絡,今年上半年憑借扎實的技術儲備和豐富的維護經驗,金鷗帶領團隊實現網絡故障處理及時率同比提升13%,結單及時率達99.9%。
記者:從考核的各項指標來看,尤其是在同比基礎上,你們團隊上半年完成非常好。在這些方面,您覺得做好這些指標的關鍵是什么?
金鷗:網絡故障的處理其實非常繁雜,網絡故障處理指標的提升其實就是從每一個故障、每一個隱患的處理開始的,做好這些指標就是要靜下心來,重視每個故障,對每個故障進行分析和管控。當然,在這過程中利用自身的技術優勢,進行經驗總結分享、方法和手段的提升也都是必不可少的。
記者:聽說你今年還編寫了案例?
金鷗:是的,作為維護部門,集團內部很早就有案例和經驗分享的形式存在,但不夠系統。今年初,正好集團內部搭建了工作云環境,我就想借著這個契機,著手系統地整理和編寫內部傳輸專業案例庫。用了半年的時間,整理發布案例29個。