7月8日,上海電信SDN平臺網關接入數量宣布突破20萬。這套在今年4月開始逐步放開現網商用的網關項目,代表了上海電信自主創新服務轉型的最新歷程,從零到10萬,再到20萬的用戶接入規模的大幅增長,則進一步證明了市場對上海電信自主研發產品的認可。
在這背后有一群人在默默付出,他們不斷迭代重構,為真正提升上海電信“軟”服務實力而日夜兼程。張旗斌作為上海NOC接入網絡維護分中心SDN開發與運營的核心專業崗位人才,在SDN網關項目中發揮著重要核心骨干作用。在他看來,平臺接入能力的不斷提升,接入用戶數的不斷增長,都意味著他所在的運維團隊責任更重了。
華麗轉型
SDN,是“軟件定義網絡”的英語單詞首字母縮寫,在云計算大數據時代,SDN網關就是通過軟件集中控制網絡編排方式,推動家庭網關的編排控制能力“上云”,從而降低網關硬件的部署成本,同時實現公客業務的快速部署。
記者:在開發、部署SDN過程中,你和你的團隊具體做了些什么?
張旗斌:一年前我們就開始進行“SDN網關整套協議棧”的自主研發。參與項目有來自總師的技術牛人、來自網絡維護一線的技術骨干,我們必須拋開過去在運維開發中積累的經驗,向全新的主流互聯網技術進發,在這個方面我們必須加速前行。
經過一年多努力,我陸續開發過SDN自服務系統、圖形化流表監測調試工具、大規模SDN模擬網關壓測系統,參與制定了嚴格的平臺能力測試方案,這些系統和工具的研發成功都確保了SDN網關的規模上線。后來我帶領團隊,獨立出來進行SDN平臺落地運維,并入網運寬帶接入運維體系。我們結合外線裝維過程,了解實際需要,使用php/python開發快速判障支撐工具,為開發運維一體化轉型做好技術準備。
記者:在這個過程中,最大的技術難度在哪里?
張旗斌:從后端運維到目前大型SDN系統開發,背后經歷一個艱難的轉型過程。為了驗證平臺能力,我們從零開始搭建壓力測試平臺,整個過程自學了linux內核參數調優、虛擬機應用向容器化技術遷移、大規模IP網絡模擬。為了使支撐工具能與工單、資源系統對接,我們嘗試了各種方法,包括程序反編譯、網絡通信分析等非常規手段都用上了,在完成協議破解后,我們還必須用純手工代碼一行一行調試,確保精準度。互聯網上各類新興技術的出現,我們得知道如何去選擇和學習它們,跨過這道坎,才能駕馭和整合它們。
記者:對你個人而言,你面臨著什么新的挑戰?
張旗斌:我是從后端運維出身的,我的工作經歷過PSTN交換機維護、NGN網絡維護、互聯網安全。我熟悉后端維護流程,如今轉型至裝維一線領域的軟件開發,對于我是新的領域。過去單純維護SDN平臺,對服務器的維護駕輕就熟,但隨著家庭網關項目和流程支撐職責的介入,我還需要面對用戶體驗等新問題,我正在學習、適應。
術有專攻
在SDN網關試點初期,由于現場裝維人員對新設備、新流程不熟,故障量明顯增加,而后臺運維人員少,導致裝維支撐請求出現大爆發。為了解決這個難題,張旗斌和團隊自主開發了支撐工具。支撐工具主要實現了自動化預檢,代替人工在多個系統中查詢數據,給出基本的故障定位——通過快速定位上游系統工單接收、平臺業務處理下發及網關運行狀態異常等存在的故障點,加快售中協調單的處理速度,將裝維支撐效率提高50%以上。
記者:公司內部像你這樣的SDN網關專業人才大概有多少?
張旗斌:我們常常自稱是在啃一塊硬骨頭,非常非常硬。SDN技術是整套技術棧,與SDN-WAN、云資源池都相關。但真正能把SDN應用在用戶家庭網關的寬帶接入技術上的,在上海電信內應該就只有SDN項目組的同事們,也就二十來人。在整個項目組開發和落地運維期間,我們自己培養了硬件開發、平臺開發、容器云技術、平臺開發運維等方面的人才。
記者:接手SDN后你的工作和生活發生了哪些變化?
張旗斌:沖在產品開發一線,并要維護好這個產品是件很苦很累的事情。新技術是否會在落地的過程中水土不服?修正問題的速度是否會跟不上放號速度?這些都是我一直在思考的問題。不比以前那段靜心開發的時光,現在帶著團隊撲在運維和支撐上,天天覺得時間不夠。現在對我最大的挑戰是如何平衡好工作和生活。可能長期的加班形成了慣性思維,一直圍著工作轉而忽視了在家里應該承擔的責任。三口之家的長途旅行,各種計劃和安排都是夫人搞定,自己像是個臨時的參與者,還是感覺挺對不起家人的。