基層央行業(yè)務網(wǎng)超融合平臺探索

時間:2022-07-16 11:51:20

導語:基層央行業(yè)務網(wǎng)超融合平臺探索一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

基層央行業(yè)務網(wǎng)超融合平臺探索

摘要:業(yè)務網(wǎng)超融合平臺是人民銀行邵陽市中心支行解決信息系統(tǒng)“孤島式的建設和應用模式”的重要舉措,是信息系統(tǒng)虛擬化建設道路上一個非常重要的嘗試。本文介紹了該平臺的建設、完善過程和主要做法,并對實際運維情況進行小結。

關鍵詞:金融科技;超融合平臺;運維

一、引言

當前,人民銀行信息化建設發(fā)展迅速,但基層央行在系統(tǒng)的上線及運維方面,一直以來都存在“孤島式”的建設和應用弊端,存在建設周期長、資源利用率低等問題,數(shù)據(jù)的安全性及工作效率有待提高。中國人民銀行邵陽市中心支行(以下簡稱“人行邵陽中支”)為了解決弊端,積極探索虛擬化建設,于2017年11月初立項建設業(yè)務網(wǎng)超融合平臺,2018年1月18日正式上線。在實際運行過程中,該行不斷總結、不斷探索,先后進行了2次升級(一次平臺架構升級、一次網(wǎng)絡結構升級),逐步完善平臺,最終圓滿達成了建設目標。

二、探索背景

(一)平臺拓撲簡單,風險抵御能力不足。在平臺建設初期,人行邵陽中支決定整個平臺的建設分多步進行,首期升級原有閑置服務器的硬件配置,在此基礎上搭建一個雙節(jié)點超融合架構平臺,今后再根據(jù)需要逐步升級平臺。初期的拓撲如圖1所示。初期平臺上創(chuàng)建了服務器網(wǎng)段、安全設備網(wǎng)段、測試網(wǎng)段等3個虛網(wǎng),遷移了公文流轉、TIPS前置系統(tǒng),邵陽金信港、邵陽電子設備管理系統(tǒng),遠程培訓課程分發(fā)子系統(tǒng)主機、遠程培訓課程分發(fā)子系統(tǒng)主機和備機等6個在用應用系統(tǒng),后期又創(chuàng)建了6個用于測試的云盤系統(tǒng)虛擬機。平臺CPU、內(nèi)存、存儲資源充足,完全能滿足所有虛擬機運行及數(shù)據(jù)實時備份的需求。但是在雙節(jié)點架構運行時,一旦其中一個節(jié)點故障,在故障節(jié)點修復前平臺的運行壓力將急劇增加,可能影響某些部署在平臺上的系統(tǒng)的流暢性。同時,還將暫時出現(xiàn)單點風險。(二)局域網(wǎng)拓撲過時,效率及安全性有待提升。一是從平臺拓撲結構及局域網(wǎng)拓撲結構上來看,業(yè)務出口分別用千兆雙絞線與兩臺核心交換機相連。實際上,由于兩臺核心交換機通過傳統(tǒng)“MSTP+VRRP”架構進行組網(wǎng)連接,平臺兩條業(yè)務出口線路中有一條處于阻斷狀態(tài),其網(wǎng)絡利用率最多只能達到50%。局域網(wǎng)拓撲亟待優(yōu)化,平臺入網(wǎng)連接方式有待改進。中心網(wǎng)絡的可靠性及轉發(fā)能力亟待提高。二是從網(wǎng)絡管理層面來看,平臺上線后,業(yè)務網(wǎng)的業(yè)務系統(tǒng)、平臺軟件等全部部署在同一個虛網(wǎng)內(nèi)(服務器虛網(wǎng)),無法做到對平臺訪問控制的最小權限配置,不便于對服務器進行分類管理及精細化訪問控制,存在一定的風險隱患。(三)運維不夠深入,平臺功能有待深挖。平臺上線后,人行邵陽中支組織力量平穩(wěn)地將現(xiàn)行的業(yè)務系統(tǒng)逐一遷入平臺,實現(xiàn)了業(yè)務系統(tǒng)的實時備份。管理員每天巡檢平臺實體機的工作狀態(tài),登錄平臺查看虛擬機的狀態(tài),并在業(yè)務系統(tǒng)維護前保存快照。監(jiān)控和運維手段比較單一,未能完全發(fā)揮出超融合平臺的智能化功能。

三、主要做法

(一)升級平臺架構,提升平臺健壯性。為了解決平臺風險抵御能力不足的隱患,并擴充平臺的存儲空間,人行邵陽中支新購入了一臺服務器,把平臺升級到3節(jié)點架構。新的架構充分考慮冗余設計,提升了平臺的容錯能力,如極大地降低了平臺在硬件和線路兩個方面的單點隱患。硬件方面,由于服務器數(shù)量增加到3臺,在一臺實體機故障宕機的情況下,平臺完全有能力支撐目前的所有業(yè)務正常運行,為故障機器的維修恢復提供了充足的時間。線路方面,平臺的業(yè)務出口和存儲通信均采用冗余連接。每臺服務器分別分配2個業(yè)務端口連接至2臺核心交換機,2個存儲通信端口連接至2臺存儲通信交換機,其中任何一條線路或交換機故障均不會影響平臺的正常運行。由于服務器端口資源有限,管理端口和VXLAN通信端口暫時不做冗余連接。平臺升級后的拓撲如圖2所示。(二)優(yōu)化網(wǎng)絡結構,拓展平臺高效性。為了從網(wǎng)絡層面上拓展平臺的高效性,人行邵陽中支對業(yè)務網(wǎng)核心交換機進行了虛擬化升級。經(jīng)過充分的市場調(diào)研及可行性驗證,在現(xiàn)網(wǎng)設備上增加了兩塊堆疊板卡和兩塊萬兆業(yè)務板卡,通過堆疊板卡組建CSS系統(tǒng),實現(xiàn)了核心交換機虛擬化。接下來,人行邵陽中支將原有的平臺實體機與核心交換機之間的所有連線進行了聚合,實現(xiàn)了業(yè)務出口的負載均衡。這樣,在擴容網(wǎng)絡效率的同時,保護了已有投入,同時簡化了設備的配置和管理,提高了系統(tǒng)的可靠性。因此,網(wǎng)絡利用率、切換速度等方面都有了大幅度提升。核心交換機虛擬化升級后平臺的拓撲如圖3所示(三)細化網(wǎng)絡管理,提高平臺安全性。根據(jù)人行邵陽中支局域網(wǎng)IP地址的應用現(xiàn)狀及今后虛擬化建設的發(fā)展需求,該行將服務器生產(chǎn)區(qū)劃分為應用服務器、平臺服務器、存儲服務器、特殊服務器等4個虛網(wǎng)。其中,原服務器網(wǎng)段變更為應用服務器網(wǎng)段。應用服務器子網(wǎng)段主要部署對外提供服務的應用系統(tǒng)(如當前在用的所有應用系統(tǒng)),平臺服務器子網(wǎng)主要部署超融合平臺服務器,存儲服務器主要部署網(wǎng)絡存儲服務器(比如云盤系統(tǒng)、FTP服務器等),特殊服務器主要部署今后新上線的對訪問控制較為嚴格的應用服務器。虛網(wǎng)調(diào)整完成后,將平臺從應用服務器子網(wǎng)段遷移到了平臺服務器子網(wǎng),并對平臺服務器子網(wǎng)設置了嚴格的訪問控制,只允許本地網(wǎng)管人員及系統(tǒng)管理員的IP訪問,極大地提高了平臺的安全性。(四)挖掘平臺功能,增強運維便捷性。平臺上線后,業(yè)務網(wǎng)內(nèi)除上級托管在機房的4臺設備外,其他業(yè)務網(wǎng)應用服務器已基本遷移到平臺上,且今后上線的新系統(tǒng)也將部署在平臺上,平臺實際上已經(jīng)成為服務器生產(chǎn)區(qū)。因此,如何充分發(fā)揮平臺的效用,提升運維便捷性,值得人行邵陽中支認真思考。1.虛擬機外部備份。上線初期,平臺的虛擬機備份均位于平臺本地,一旦平臺出現(xiàn)崩潰式故障,就會存在丟失所有數(shù)據(jù)的風險?;趯⑻摂M機備份獨立于平臺之外的思路,人行邵陽中支咨詢廠家,找到了平臺虛擬機外部備份的方法。平臺是通過創(chuàng)建備份池來存放備份數(shù)據(jù)的,而備份池的位置可以選擇本地或Windows共享目錄,還可以通過iSCSI服務擴展虛擬存儲。其中,Windows共享目錄和iSCSI服務擴展虛擬存儲的方式可以將虛擬機備份到外部。兩種方式對比而言,iSCSI服務擴展虛擬存儲安全性更高,但需要提供支持iSCSI服務協(xié)議的外部設備??紤]到實際情況,在不增加投入的前提下,人行邵陽中支選擇采用Windows共享的方式,將平臺虛擬機備份到安裝了Windowsserver2008系統(tǒng)的閑置服務器上。為了提高備份服務器的安全性,將備份服務器部署在平臺服務器子網(wǎng)并設置了嚴格的訪問策略,只允許平臺服務器訪問該備份服務器。外部備份配置完成后,平臺每天23:00開始將虛擬機自動備份到備份服務器,提高了數(shù)據(jù)安全性。2.啟用平臺監(jiān)控。登錄平臺后,在首頁可以看到一些簡單的平臺運行數(shù)據(jù),方便值班人員及時了解平臺的運行情況。但該界面內(nèi)容過于簡單,值班人員如果需要了解各虛擬機的詳細運行情況,需要進入不同的模塊調(diào)閱,往往層級還比較深,操作比較復雜,反應時間比較長。有的甚至需要從系統(tǒng)管理員處獲得授權才能進入應用系統(tǒng),增加了值班人員巡檢的難度。為了使日常巡檢變得更加方便快捷,人行邵陽中支啟用了平臺的監(jiān)控中心功能。監(jiān)控中心界面布局大方,科技感強,更直觀地展示當前各業(yè)務系統(tǒng)的運行狀況、資源占用情況、告警情況等,更能一鍵進入虛擬機詳情界面,全面、直觀地展現(xiàn)虛擬機實時狀況。監(jiān)控中心的啟用,大大地提高了值班人員的工作效率。3.平臺故障通知。平臺具備了強大的故障監(jiān)控功能,當平臺發(fā)生諸如網(wǎng)絡異常(如某個端口掉線)、資源不足(如某個虛擬機內(nèi)存不足)、操作失?。ㄈ鐐浞菔。┑裙收蠒r,均會產(chǎn)生告警記錄。告警信息會及時在平臺首頁顯示,使值班人員巡檢時能及時發(fā)現(xiàn)。然而人行邵陽中支并不滿足于登錄系統(tǒng)發(fā)現(xiàn)告警,而更希望告警信息能實時通過其他方式通知運維人員。通過查詢平臺白皮書及咨詢廠商發(fā)現(xiàn),系統(tǒng)本身自帶郵件通知功能。該功能配置完成并啟用后,平臺可以將告警信息實時發(fā)送到目的郵箱,在及時通告告警信息的同時擴大了告警信息的獲知群體(由單一值班人員擴展到全科人員),提高了平臺故障處理的時效性。(五)制訂平臺制度,強化運維規(guī)范性。在日常運維方面,人行邵陽中支堅決落實上級行“三道防線”的要求,積極推動平臺在運行維護、風險控制、安全審計全方位落實到位。系統(tǒng)試運行后,其先后制定了《超融合平臺運維管理制度》和《超融合平臺應急預案》,從職責分工、運維流程、安全保密、應急資源、應急管理等多個方面提升平臺的安全保障。

四、小結

人行邵陽中支業(yè)務網(wǎng)超融合平臺已上線運行2年多,平臺的各項指標性能良好,運行穩(wěn)定。在這2年的運維中,人行邵陽中支認真觀察、大膽探索,圍繞平臺的安全性、健壯性、便捷性、穩(wěn)定性開展調(diào)研,從平臺架構、平臺運行環(huán)境、平臺功能挖掘、平臺制度建設等方面入手,進行大量的實驗及調(diào)整工作,實現(xiàn)了構建一個安全、可靠、便捷、高效、節(jié)能的虛擬化平臺的目標。

參考文獻:

[1]張棟鍇,郭東旭. 超融合架構在商業(yè)銀行省級分行中的應用[J]. 金融科技時代,2019(7):32-36.

[2]張光華. 超融合系統(tǒng)架構在數(shù)據(jù)中心的應用研究[J]. 通訊世界,2017(9):21-

[3]謝藝平,趙丹銳. 淺析服務器虛擬化常見的安全隱患及其防范措施[J]. 現(xiàn)代信息科技,2018(11):153-154. 

作者:張勇 單位:中國人民銀行邵陽市中心支行