《運維服務標準(共6頁)》由會員分享,可在線閱讀,更多相關《運維服務標準(共6頁)(6頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、精選優(yōu)質文檔-----傾情為你奉上
運維服務標準
目錄
1.引言
1.1 編寫目的
為了更好的服務客戶,保障公司運維工作的有序開展,規(guī)范運維工作和人員服務,使運維人員操作標準化,避免人為操作不當引起的重大、關鍵運維事故,根據(jù)CSA的要求,特制定此運維服務規(guī)范。 本規(guī)范是公司運維的基本依據(jù),維護崗位人員必須嚴格遵照執(zhí)行。
1.2適用范圍
本規(guī)范所指的系統(tǒng)指公司承接的運維項目中涉及的范圍,按合同約定包括:
1) 設備管理:對網(wǎng)絡設備,服務器設備,
2、操作系統(tǒng),運行狀況進行監(jiān)控,對各種應用支持軟件如數(shù)據(jù)庫,中間件以及各種通用或特定服務的監(jiān)控管理,如郵件系統(tǒng),DNS,web等的監(jiān)控和管理。
2) 數(shù)據(jù)/存儲/容災管理:對系統(tǒng)和業(yè)務數(shù)據(jù)進行統(tǒng)一存儲,備份和恢復。
3) 業(yè)務監(jiān)控與管理。
4) 目錄內(nèi)容管理:針對企業(yè)需要統(tǒng)一發(fā)布或者因人定制的內(nèi)容的管理和對公共信息的管理。
5) 資源資產(chǎn)管理:管理企業(yè)中個IT系統(tǒng)的資源資產(chǎn)情況。可以是物理存在的,也可以是邏輯存在的,并能同公司財務部門進行數(shù)據(jù)交互。
6) 信息安全管理:主要依據(jù)ISO17799標準,涵蓋了信息安全管理的十大控制方面,如企業(yè)安全組織方式,資產(chǎn)分類與控制,人員安全,物理與環(huán)境
3、安全,通信與運營安全,訪問控制,業(yè)務連續(xù)性管理等。
7)日產(chǎn)工作管理:該部分主要用于規(guī)范和明確運維人員的崗位職責和工作安排。提供績效考核量化依據(jù),提供決絕問題經(jīng)驗與知識的積累與共享手段。
1.3行為準側
1) 認真負責,遵循首問責任制
2) 不抱怨,不推諉,不拖拉
3) 多溝通,多思考,多請教
4) 控制陳本,倡導節(jié)約
5) 遵循規(guī)則,舉止得體
6) 實事求是,誠實守信
7) 處理故障為主,定位責任為輔
8) 預防性維護為主,故障性維護為輔
1.4 服務紀律
1) 影響用戶使用的事不做
2) 損害用戶權益的事不做
3) 造成用戶反感的事不做
4) 嚴格遵守我司服
4、務水平協(xié)議進行服務
1.5 遠離故障十大原則
1) 備份并驗證備份有效性。
2) 凡事有備份,可回滾。
3) 運維自動化,拒絕重復勞動,運維程序化,平臺化。
4) 運維白盒化,深入理解運維產(chǎn)品。
5) 部署容器化,生產(chǎn)和部署環(huán)境統(tǒng)一。
6) 日志報警自動化。自動獲取出錯信息,并自動進行更正。
7) 運維智能化。自動分析歷史信息,獲得運行趨勢,預測未來。
8) 交接休假準備充分。
9) 日常操作確認機制,所有操作反復確認后提交。
10) 權限設置嚴格化,避免錯誤操作。
2、運維服務準則和要求
2.1 基本要求
1)遵守客戶業(yè)務管理和現(xiàn)場管理要求
2)周期性維護工作
5、應經(jīng)客戶審批同意后方可實施。
3)因故障修復,功能升級引起的系統(tǒng)版本升級和割接工作應經(jīng)客戶測試通過后方可實施。
4)未經(jīng)客戶同意,各維護崗人員不得私自對客戶在線數(shù)據(jù)進行變更,參數(shù)調(diào)整,硬件設備調(diào)整。
5)維護人員須經(jīng)業(yè)務和管理培訓,明確崗位職責,通過部門考核確認后方可上崗。在客戶現(xiàn)場以執(zhí)行運維工作,遵循各項運維管理制度。
6)定期檢查維護系統(tǒng)的安全狀況,為客戶提供合理的安全處理措施。
2.2 檔案記錄
機房或者云網(wǎng)絡、安全設備配置,服務器詳情信息,存儲設備配置及軟件系統(tǒng)的基本信息,使用信息和維護記錄要明細健全。
2.3網(wǎng)絡運維服務標準和要求
1)日常巡檢。每周完成網(wǎng)絡設備,安
6、全設備物理和運行狀態(tài)的檢查,主要包括各接入單位網(wǎng)絡鏈路狀態(tài);核心路由各物理接口配置及狀態(tài);接入交換機物理狀態(tài);安全設備(防火墻,數(shù)據(jù)庫安全設計,流量分析,實名準入等)日常巡檢;門禁系統(tǒng)日創(chuàng)巡檢;鏈路層負載均衡器,上網(wǎng)行為管理,web防火墻等日志的查看。
2)設備配置修改及備份。做好交換機、路由器等設備的配置和策略信息的登記、修改或升級記錄。每月將核心配置信息安全備份一次。
2.4 服務器及存儲設備運維標注和要求(自動化監(jiān)控)
1)日常巡檢,每周完成個機房服務器、云服務器、存儲設備等物理和運行狀態(tài)的檢測。每日對設備操作系統(tǒng),應用系統(tǒng)或數(shù)據(jù)庫進行遠程巡和實時監(jiān)控,每周一次現(xiàn)場運行狀態(tài)巡檢,形
7、成相關記錄。
2)軟件升級,做好服務器操作系統(tǒng)更新、防毒軟件部署升級工作。
3)根據(jù)自動化監(jiān)控平臺提供的日志信息和自動報警信息,自動化選擇調(diào)控方案進行自動化調(diào)控。保證系統(tǒng)穩(wěn)定性和安全性。通過容器化集群技術,自動進行容災和錯誤轉移,保證系統(tǒng)可用性。
2.5 綜合報表
每月需將機房/云設備、網(wǎng)絡、軟件運行情況形成綜合運行分析報告。
3故障響應及解決要求
日常巡檢過程發(fā)現(xiàn)故障,應及時上報;除現(xiàn)場服務外,提供7*24小時電話支持,并提供兩人以上應急聯(lián)系方式。
針對停電、重大網(wǎng)絡安全、系統(tǒng)崩潰等重大事故,指定相應預案,并按要求進行應急演練。
故障響應,針對設備或者網(wǎng)絡連接故障,按照不同
8、等級,明確各應用故障的解決時間表:
故障等級
響應時間
故障恢復時間
1級:緊急問題
表現(xiàn):系統(tǒng)崩潰,業(yè)務停滯,數(shù)據(jù)丟失,訪問中斷
20分鐘內(nèi)響應
2小時內(nèi)提供故障處理方案
6小時
2級:嚴重問題
表現(xiàn):部分服務失效,影響系統(tǒng)正常運行,網(wǎng)絡丟包嚴重,延遲大,影響正常訪問
半小時內(nèi)響應
2小時內(nèi)提供故障處理方案
12小時
3級:較嚴重問題
表現(xiàn):出現(xiàn)報錯或報警,但業(yè)務能繼續(xù)運行且性能影響較小
半小時響應
4小時內(nèi)提交故障處理方案
24小時
4級:普通問題
表現(xiàn):系統(tǒng)技術功能,安裝或者配置咨詢,或其他不影響業(yè)務的預約服務
1小時響應
24小時內(nèi)提交故障處理方案
48小時
專心---專注---專業(yè)