7月8日,上海電信SDN平臺網(wǎng)關(guān)接入數(shù)量宣布突破20萬。這套在今年4月開始逐步放開現(xiàn)網(wǎng)商用的網(wǎng)關(guān)項目,代表了上海電信自主創(chuàng)新服務(wù)轉(zhuǎn)型的最新歷程,從零到10萬,再到20萬的用戶接入規(guī)模的大幅增長,則進一步證明了市場對上海電信自主研發(fā)產(chǎn)品的認可。
在這背后有一群人在默默付出,他們不斷迭代重構(gòu),為真正提升上海電信“軟”服務(wù)實力而日夜兼程。張旗斌作為上海NOC接入網(wǎng)絡(luò)維護分中心SDN開發(fā)與運營的核心專業(yè)崗位人才,在SDN網(wǎng)關(guān)項目中發(fā)揮著重要核心骨干作用。在他看來,平臺接入能力的不斷提升,接入用戶數(shù)的不斷增長,都意味著他所在的運維團隊責(zé)任更重了。
華麗轉(zhuǎn)型
SDN,是“軟件定義網(wǎng)絡(luò)”的英語單詞首字母縮寫,在云計算大數(shù)據(jù)時代,SDN網(wǎng)關(guān)就是通過軟件集中控制網(wǎng)絡(luò)編排方式,推動家庭網(wǎng)關(guān)的編排控制能力“上云”,從而降低網(wǎng)關(guān)硬件的部署成本,同時實現(xiàn)公客業(yè)務(wù)的快速部署。
記者:在開發(fā)、部署SDN過程中,你和你的團隊具體做了些什么?
張旗斌:一年前我們就開始進行“SDN網(wǎng)關(guān)整套協(xié)議棧”的自主研發(fā)。參與項目有來自總師的技術(shù)牛人、來自網(wǎng)絡(luò)維護一線的技術(shù)骨干,我們必須拋開過去在運維開發(fā)中積累的經(jīng)驗,向全新的主流互聯(lián)網(wǎng)技術(shù)進發(fā),在這個方面我們必須加速前行。
經(jīng)過一年多努力,我陸續(xù)開發(fā)過SDN自服務(wù)系統(tǒng)、圖形化流表監(jiān)測調(diào)試工具、大規(guī)模SDN模擬網(wǎng)關(guān)壓測系統(tǒng),參與制定了嚴格的平臺能力測試方案,這些系統(tǒng)和工具的研發(fā)成功都確保了SDN網(wǎng)關(guān)的規(guī)模上線。后來我?guī)ьI(lǐng)團隊,獨立出來進行SDN平臺落地運維,并入網(wǎng)運寬帶接入運維體系。我們結(jié)合外線裝維過程,了解實際需要,使用php/python開發(fā)快速判障支撐工具,為開發(fā)運維一體化轉(zhuǎn)型做好技術(shù)準備。
記者:在這個過程中,最大的技術(shù)難度在哪里?
張旗斌:從后端運維到目前大型SDN系統(tǒng)開發(fā),背后經(jīng)歷一個艱難的轉(zhuǎn)型過程。為了驗證平臺能力,我們從零開始搭建壓力測試平臺,整個過程自學(xué)了linux內(nèi)核參數(shù)調(diào)優(yōu)、虛擬機應(yīng)用向容器化技術(shù)遷移、大規(guī)模IP網(wǎng)絡(luò)模擬。為了使支撐工具能與工單、資源系統(tǒng)對接,我們嘗試了各種方法,包括程序反編譯、網(wǎng)絡(luò)通信分析等非常規(guī)手段都用上了,在完成協(xié)議破解后,我們還必須用純手工代碼一行一行調(diào)試,確保精準度。互聯(lián)網(wǎng)上各類新興技術(shù)的出現(xiàn),我們得知道如何去選擇和學(xué)習(xí)它們,跨過這道坎,才能駕馭和整合它們。
記者:對你個人而言,你面臨著什么新的挑戰(zhàn)?
張旗斌:我是從后端運維出身的,我的工作經(jīng)歷過PSTN交換機維護、NGN網(wǎng)絡(luò)維護、互聯(lián)網(wǎng)安全。我熟悉后端維護流程,如今轉(zhuǎn)型至裝維一線領(lǐng)域的軟件開發(fā),對于我是新的領(lǐng)域。過去單純維護SDN平臺,對服務(wù)器的維護駕輕就熟,但隨著家庭網(wǎng)關(guān)項目和流程支撐職責(zé)的介入,我還需要面對用戶體驗等新問題,我正在學(xué)習(xí)、適應(yīng)。
術(shù)有專攻
在SDN網(wǎng)關(guān)試點初期,由于現(xiàn)場裝維人員對新設(shè)備、新流程不熟,故障量明顯增加,而后臺運維人員少,導(dǎo)致裝維支撐請求出現(xiàn)大爆發(fā)。為了解決這個難題,張旗斌和團隊自主開發(fā)了支撐工具。支撐工具主要實現(xiàn)了自動化預(yù)檢,代替人工在多個系統(tǒng)中查詢數(shù)據(jù),給出基本的故障定位——通過快速定位上游系統(tǒng)工單接收、平臺業(yè)務(wù)處理下發(fā)及網(wǎng)關(guān)運行狀態(tài)異常等存在的故障點,加快售中協(xié)調(diào)單的處理速度,將裝維支撐效率提高50%以上。
記者:公司內(nèi)部像你這樣的SDN網(wǎng)關(guān)專業(yè)人才大概有多少?
張旗斌:我們常常自稱是在啃一塊硬骨頭,非常非常硬。SDN技術(shù)是整套技術(shù)棧,與SDN-WAN、云資源池都相關(guān)。但真正能把SDN應(yīng)用在用戶家庭網(wǎng)關(guān)的寬帶接入技術(shù)上的,在上海電信內(nèi)應(yīng)該就只有SDN項目組的同事們,也就二十來人。在整個項目組開發(fā)和落地運維期間,我們自己培養(yǎng)了硬件開發(fā)、平臺開發(fā)、容器云技術(shù)、平臺開發(fā)運維等方面的人才。
記者:接手SDN后你的工作和生活發(fā)生了哪些變化?
張旗斌:沖在產(chǎn)品開發(fā)一線,并要維護好這個產(chǎn)品是件很苦很累的事情。新技術(shù)是否會在落地的過程中水土不服?修正問題的速度是否會跟不上放號速度?這些都是我一直在思考的問題。不比以前那段靜心開發(fā)的時光,現(xiàn)在帶著團隊撲在運維和支撐上,天天覺得時間不夠。現(xiàn)在對我最大的挑戰(zhàn)是如何平衡好工作和生活。可能長期的加班形成了慣性思維,一直圍著工作轉(zhuǎn)而忽視了在家里應(yīng)該承擔(dān)的責(zé)任。三口之家的長途旅行,各種計劃和安排都是夫人搞定,自己像是個臨時的參與者,還是感覺挺對不起家人的。