日期:2016-02-22 點擊: 關(guān)鍵詞:高校IT運維服務(wù),高校IT運維服務(wù)項目需求分析與實
隨著學(xué)校信息化建設(shè)的不斷深入,各業(yè)務(wù)系統(tǒng)的技術(shù)支持和IT基礎(chǔ)設(shè)施的運行維護已經(jīng)成為學(xué)校主管領(lǐng)導(dǎo)、業(yè)務(wù)部門普遍關(guān)注的問題。這是一個隨信息技術(shù)深入應(yīng)用而產(chǎn)生的新課題。目前,國內(nèi)許多高校的IT運維部門也都有從傳統(tǒng)的、零散孤立的網(wǎng)絡(luò)軟硬件維護上升到基于業(yè)務(wù)、基于ITIL的IT運維服務(wù)管理層面的需求。本課題的研究和實施,也為IT運維服務(wù)管理的標準化、流程化和自動化在高校的應(yīng)用實現(xiàn)進行了有益的探索。
高校IT運維現(xiàn)狀分析
IT運維理念是目前業(yè)界被討論的眾多熱門話題之一。國內(nèi)的IT運維系統(tǒng)也是多種多樣,層出不窮,這些系統(tǒng)由于針對領(lǐng)域的不同其特征也各不相同。高校做為一個特別的群體具有網(wǎng)絡(luò)設(shè)備的種類、數(shù)量多,網(wǎng)絡(luò)環(huán)境復(fù)雜,業(yè)務(wù)系統(tǒng)應(yīng)用廣泛,涉及的品牌繁雜,部分服務(wù)群體(學(xué)生)流動性高等特點。所以至今還沒有一款特別適用于高校的IT運維系統(tǒng)。但近年來,隨著教育部“教育信息化帶動教育現(xiàn)代化”理念的提出,高校信息化建設(shè)的深入和完善,保障校園網(wǎng)絡(luò)環(huán)境、網(wǎng)絡(luò)設(shè)備和各業(yè)務(wù)應(yīng)用系統(tǒng)的穩(wěn)定運行已經(jīng)成為高校信息部門的頭等大事,因為信息化的保障工作將關(guān)系到全校日常教學(xué)和工作的各個方面,一旦出現(xiàn)故障將對學(xué)校造成不可預(yù)估的影響和損失。
目前,高校的大多數(shù)IT運維服務(wù)部門仍使用傳統(tǒng)的IT運維方法,這樣存在很多問題,比如:
(1)服務(wù)器管理、網(wǎng)絡(luò)管理、機房環(huán)境監(jiān)控等系統(tǒng)相互獨立,網(wǎng)絡(luò)安全設(shè)備尚未有效監(jiān)控,故障不能準確定位;
(2)系統(tǒng)配置信息散亂在各種資料中,關(guān)鍵信息登記不完善;
(3)由于歷史問題,信息化設(shè)備登記混亂,缺乏管理;
(4)信息化運維效率較低,類似的問題經(jīng)常發(fā)生,流程沒有得到梳理,沒有解決方法可以借鑒;
(5)對IT運維人員技能要求較高,運維人員工作考核無法量化。
這些問題雖然迫在眉睫并受到足夠地重視,但遠未得到有效地解決。因此我校數(shù)字校園建設(shè)中心計劃在現(xiàn)有IT基礎(chǔ)上通過進行問題梳理,建設(shè)一套基于ITIL的IT運維服務(wù)管理系統(tǒng)。重組業(yè)務(wù)流程和變革內(nèi)部管理流程,實現(xiàn)IT技術(shù)和主要業(yè)務(wù)的整合,從而使信息化手段成為支持業(yè)務(wù)運作的強大動力,這也是近年來越來越受到關(guān)注的IT運維服務(wù)管理所要達到的目標。
IT運維服務(wù)系統(tǒng)的功能需求分析
通過對以上問題的分析得出需要搭建運維綜合管理平臺,在現(xiàn)有服務(wù)流程評估分析基礎(chǔ)上,對照ITIL標準,進行差異分析,改進和建立缺失的流程,完成IT運維流程梳理與設(shè)計。根據(jù)實際工作需求和ITIL最佳實踐,設(shè)計一套符合實際應(yīng)用、完整和規(guī)范的服務(wù)流程與運維管理平臺。要求覆蓋高校所有信息化運行、維護、服務(wù)管理的業(yè)務(wù)。
需要搭建能夠統(tǒng)一全面監(jiān)控所有信息資源的監(jiān)控平臺,具備基于三層路由協(xié)議的網(wǎng)絡(luò)發(fā)現(xiàn)和拓撲呈現(xiàn)能力,多協(xié)議物理和邏輯拓撲發(fā)現(xiàn)和呈現(xiàn)能力,全方位網(wǎng)絡(luò)設(shè)備、中間件等IP基礎(chǔ)設(shè)施、基于數(shù)據(jù)庫和Web Service接口的應(yīng)用層中間件自動發(fā)現(xiàn)及監(jiān)控。
需要搭建告警信息采集平臺。該功能應(yīng)該具備單位時間內(nèi)對網(wǎng)內(nèi)的設(shè)備、系統(tǒng)進行輪詢,實時監(jiān)測可能發(fā)生的問題。在問題發(fā)生的第一時間快速響應(yīng),并對問題做出分類,不同問題給出不同的相應(yīng)級別,通過郵件、短信等方式通知相關(guān)運維人員。較快速的解決問題。存儲并對問題進行分析,供相關(guān)人員決策。
系統(tǒng)應(yīng)具有審計日志、錯誤日志、管理員日志和操作者日志等功能,并對日志內(nèi)容進行相關(guān)保護、分析和呈現(xiàn)。支持對IT運維服務(wù)各類業(yè)務(wù)進行統(tǒng)計,提供多種組合條件(事件次數(shù)及分類、用戶數(shù)量、使用時長、常用功能等)的查詢、統(tǒng)計。以即時或指定時間段為周期,形成業(yè)務(wù)統(tǒng)計報表。
IT運維服務(wù)系統(tǒng)的構(gòu)思與落地
1.系統(tǒng)架構(gòu)設(shè)計
通過對系統(tǒng)建設(shè)需求和應(yīng)用模式的分析,對總體架構(gòu)進行了分層設(shè)計。系統(tǒng)采用了四層體系架構(gòu),系統(tǒng)的四層體系架構(gòu)自上而下分別是展示層、邏輯層、配置層、管理對象層。展現(xiàn)層包含了系統(tǒng)應(yīng)用程序中需要和用戶交互的組件。是系統(tǒng)功能實現(xiàn)、人機交互的窗口;邏輯層是實現(xiàn)系統(tǒng)所有運維業(yè)務(wù)管理功能的支撐,是基于配置層定制的滿足IT運維業(yè)務(wù)需求各種流程的管理應(yīng)用,由事件管理、問題管理、配置管理、項目管理、變更管理、服務(wù)臺等業(yè)務(wù)流程模塊,同時具備系統(tǒng)管理員入口功能;配置層為業(yè)務(wù)系統(tǒng)提供開發(fā)運行環(huán)境,將采集到的海量數(shù)據(jù)進行全面核查,在核查的基礎(chǔ)上對確實數(shù)據(jù)進行預(yù)處理和標準化處理;管理對象層是對數(shù)據(jù)采集的全過程進行控制,并對采集的數(shù)據(jù)進行加工處理,從而實現(xiàn)各種異構(gòu)信息產(chǎn)品和運維事件的信息收集,預(yù)警和告警條件的觸發(fā),為系統(tǒng)提供數(shù)據(jù)基礎(chǔ)。
2.系統(tǒng)功能設(shè)計
系統(tǒng)采用B/S模式,在現(xiàn)有的校園網(wǎng)平臺基礎(chǔ)上,實現(xiàn)對IT運維服務(wù)全方位管理。系統(tǒng)的功能結(jié)構(gòu)設(shè)計如圖1所示。
圖1 系統(tǒng)功能結(jié)構(gòu)圖
系統(tǒng)功能結(jié)構(gòu)劃分主要是根據(jù)系統(tǒng)需求分析、功能定位和方便易用的原則進行設(shè)計。本系統(tǒng)五個組件主要完成以下功能:一是系統(tǒng)IT資源統(tǒng)一監(jiān)控管理功能;二是系統(tǒng)安全和告警管理功能;三是系統(tǒng)自身管理和系統(tǒng)日志管理功能;四是統(tǒng)計分析管理功能;五是運維服務(wù)綜合管理功能。系統(tǒng)采用整體設(shè)計、分步實現(xiàn)的原則。
(1)IT資源統(tǒng)一監(jiān)控平臺
1)網(wǎng)絡(luò)拓撲自動發(fā)現(xiàn)
網(wǎng)絡(luò)拓撲自動發(fā)現(xiàn)需要滿足:準確性、實時性、完整性、低負載的要求。需要支持維護人員手工修改拓撲圖。最后決定在自動發(fā)現(xiàn)的過程中,優(yōu)先使用各個廠商提供的專屬拓撲發(fā)現(xiàn)協(xié)議。
2)網(wǎng)絡(luò)拓撲前臺配置與展示
拓撲配置與展示在系統(tǒng)中占有非常重要的地位。網(wǎng)絡(luò)管理系統(tǒng)中的拓撲圖展示將包括如下要素:
背景圖:可先把眾多網(wǎng)絡(luò)設(shè)備分為多個區(qū)域,如果某個區(qū)域出現(xiàn)告警,則這個區(qū)域的代表圖標進行告警提示;另外,一些不方便用動態(tài)圖形展現(xiàn)的靜態(tài)信息,比如文字描述,靜態(tài)連線,特殊標識等,也可以放在背景圖中;
節(jié)點:作為被監(jiān)控設(shè)備的數(shù)字化代表,每種被監(jiān)控實體都會有屬于自己的圖形標識,每種類型的被監(jiān)控實體,如主機、數(shù)據(jù)庫、路由器等圖形標識不同且容易區(qū)分記憶;
連線:在網(wǎng)絡(luò)中,各個被監(jiān)控實體都不是完全獨立的,拓撲展示中需要表現(xiàn)出各個實體之間的連接關(guān)系。
(2)告警和系統(tǒng)安全管理
1)告警信息實時采集
設(shè)備關(guān)聯(lián)和告警信息的自動傳達,支持接收網(wǎng)絡(luò)設(shè)備所發(fā)出的SNMP TRAP、Syslog日志告警,能實時的監(jiān)測網(wǎng)絡(luò)物理鏈路的情況、核心機房網(wǎng)絡(luò)出口設(shè)備的異常情況,并判斷是否為異常情況進而觸發(fā)告警模塊,可以根據(jù)告警事件的輕重選擇告警方式,匹配不同級別的告警信息,如流量超過一類閥值為一般告警,超過二類閥值為緊急告警等細致化功能。
2)系統(tǒng)數(shù)據(jù)備份
對故障的采集、分類、展示是整個模塊的核心功能,也是所有模塊共同工作所圍繞的中心點。首先通過采集模塊對系統(tǒng)信息進行收集,通過各種對應(yīng)的采集接口傳回采集主機。然后由采集機上相應(yīng)功能模塊進行數(shù)據(jù)檢錯、過濾、分類,并把數(shù)據(jù)入庫。然后,前臺展示程序把分類入庫的告警數(shù)據(jù)等做集中展示,并統(tǒng)計出相應(yīng)報表。
除此之外,告警信息的過濾、壓縮,故障定位及聯(lián)動,系統(tǒng)審計,數(shù)據(jù)的展示也是系統(tǒng)設(shè)計要考慮的重點。
(3)系統(tǒng)日志管理和統(tǒng)計分析管理
面向領(lǐng)導(dǎo)、運維部門主管、運維人員提供網(wǎng)絡(luò)和業(yè)務(wù)系統(tǒng)的運行狀況分析,進行運維人員的績效考核及其他相關(guān)的統(tǒng)計分析,為領(lǐng)導(dǎo)決策提供相關(guān)依據(jù)。保存過程中的所有日志文件,并進行分類。支持多重身份的驗證。比如:業(yè)務(wù)關(guān)系流程圖、設(shè)備位置分布圖、網(wǎng)絡(luò)結(jié)構(gòu)拓撲圖、流程進度時序圖、工作日歷、任務(wù)沖突分析圖等,要有優(yōu)質(zhì)的操作體驗。
(4)運維服務(wù)綜合管理
運維服務(wù)綜合管理要首先對業(yè)務(wù)流程進行梳理,將梳理的結(jié)果進行重定向。運維服務(wù)綜合管理模塊應(yīng)具備友好的流程設(shè)定功能,利用圖形化的方法快速部署。支持需求出發(fā)的流程環(huán)節(jié)快速重組,并根據(jù)需要進行增刪改操作及對流程的執(zhí)行進行監(jiān)控。實現(xiàn)實時服務(wù)監(jiān)控和績效評定。系統(tǒng)中內(nèi)置關(guān)鍵績效指標信息,提供必要的績效考評手段。自由擴展數(shù)據(jù)屬性,提供表單的自定義相關(guān)功能。根據(jù)實際需求定制符合要求的表單,使表單的信息更加標準化、規(guī)范化。
3.系統(tǒng)安全設(shè)計
系統(tǒng)安全是保護系統(tǒng)的軟硬件不受偶然的原因或惡意的攻擊行為而遭受運行中斷、數(shù)據(jù)被更改或破壞。
(1)系統(tǒng)硬件和網(wǎng)絡(luò)環(huán)境安全
將系統(tǒng)接入到學(xué)校數(shù)據(jù)中心機房的內(nèi)網(wǎng)服務(wù)器群區(qū)。有防火墻和其他安全保障措施,可以保證網(wǎng)絡(luò)安全和服務(wù)器安全。
(2)角色權(quán)限控制
系統(tǒng)支持多角色,但對角色做了嚴格的權(quán)限控制,不僅對系統(tǒng)功能模塊做了權(quán)限控制,對設(shè)備訪問權(quán)限也做了控制,保證每個用戶只能看到自己管轄范圍內(nèi)的資源,訪問權(quán)限內(nèi)的系統(tǒng)功能。
系統(tǒng)測試
1.功能測試
功能風險識別主要是兩方面,首先目前定制的功能是否滿足前期需求;其次,現(xiàn)有功能是否存在技術(shù)上的問題。驗證與需求的一致性、系統(tǒng)的穩(wěn)定性、安全性和可擴展性等。
2.流程測試
對運維服務(wù)綜合管理模塊的業(yè)務(wù)流程進行風險識別,從用戶、運維人員、系統(tǒng)管理員、決策者等角色進到系統(tǒng)中,從具體業(yè)務(wù)流程出發(fā),檢驗平臺的業(yè)務(wù)流程是否符合實際業(yè)務(wù)流程,是否符合具體業(yè)務(wù)要求。
3.性能測試
性能風險識別是通過測試工具模擬多種正常、峰值及異常負載條件來對系統(tǒng)的各項性能指標進行識別。
依據(jù)項目風險識別方法,通過上述識別過程,經(jīng)測試,系統(tǒng)功能、流程、性能已基本規(guī)避相關(guān)風險,能滿足平臺要求。
實施前后效果對比分析
系統(tǒng)實施前后效果對比如表1所示。
本文通過對當前基于ITIL理論的IT運維服務(wù)管理系統(tǒng)的分析,指出IT運維服務(wù)對于高校信息化建設(shè)的意義。為高校信息化的管理提出了構(gòu)建從IT基礎(chǔ)架構(gòu)管理面向業(yè)務(wù)管理的總體思路,從業(yè)務(wù)視角洞析IT管理的全過程,為業(yè)務(wù)的正常運作提供了強有力的保障,提高服務(wù)對象的整體客戶滿意度。
來源:互聯(lián)網(wǎng)