《大集中系統(tǒng)集成方案運(yùn)維手冊(cè)》由會(huì)員分享,可在線閱讀,更多相關(guān)《大集中系統(tǒng)集成方案運(yùn)維手冊(cè)(10頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、
神州數(shù)碼
1 Ci 2
神州數(shù)碼軟件有限公司
密級(jí):限項(xiàng)目?jī)?nèi)使用
山東省地稅省級(jí)大集中項(xiàng)目
系統(tǒng)集成方案
運(yùn)維管理
編寫(xiě)人:
編寫(xiě)日期:
審核人:
審核日期:
批準(zhǔn)人:
批準(zhǔn)日期:
神州數(shù)碼軟件有限公司
地稅開(kāi)發(fā)部
1運(yùn)維管理崗位職責(zé)
1.1運(yùn)行維護(hù)內(nèi)谷
運(yùn)行維護(hù)內(nèi)容包括網(wǎng)絡(luò)管理、系統(tǒng)(主機(jī)系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)、中間件系統(tǒng)) 和應(yīng)用管理、安全管理、存儲(chǔ)備份管理、故障管理、決策分析管理、技術(shù)支持管 理。相互間的關(guān)系見(jiàn)下圖:
f *
稅務(wù)應(yīng)用視圖
網(wǎng)絡(luò)
<—
系統(tǒng)和應(yīng)用管理
安全管理
網(wǎng)絡(luò)安全 主機(jī)安全 應(yīng)用安
2、全
決策分析管理
A
配置管理
性能管理
資源管理
技術(shù)支 持管理
支持結(jié)構(gòu) 支持人員 管理流程 知識(shí)庫(kù)
性能管理 資源管理
存儲(chǔ)備份管理
1.1.1網(wǎng)絡(luò)管理內(nèi)容
網(wǎng)絡(luò)管理主要實(shí)現(xiàn)網(wǎng)絡(luò)的配置管理、性能管理和可靠性管理。網(wǎng)絡(luò)管理主要 基于網(wǎng)絡(luò)管理平臺(tái)和網(wǎng)絡(luò)管理軟件實(shí)現(xiàn)。網(wǎng)絡(luò)配置主要對(duì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和網(wǎng)絡(luò)設(shè) 備參數(shù)進(jìn)行配置,網(wǎng)絡(luò)性能管理主要通過(guò)對(duì)被管理設(shè)備的監(jiān)控和輪詢, 獲取有關(guān)
網(wǎng)絡(luò)運(yùn)行的信息及統(tǒng)計(jì)數(shù)據(jù),并在所收集的數(shù)據(jù)的基礎(chǔ)上,提供網(wǎng)絡(luò)的性能統(tǒng)計(jì); 網(wǎng)絡(luò)可靠性管理主要對(duì)網(wǎng)絡(luò)的運(yùn)行狀況進(jìn)行監(jiān)控和檢查,及時(shí)察覺(jué)可能的故障, 從而保證網(wǎng)絡(luò)的正常運(yùn)行。
1.1.2 系統(tǒng)和應(yīng)
3、用管理內(nèi)容
系統(tǒng)和應(yīng)用管理內(nèi)容:系統(tǒng)管理主要實(shí)現(xiàn)對(duì)系統(tǒng)(主機(jī)系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)、 中間件系統(tǒng))的配置管理、 性能管理和可靠性管理。 配置管理包括對(duì)系統(tǒng)資源的 發(fā)現(xiàn)、提供、 配置和控制; 性能及可靠性管理主要對(duì)各系統(tǒng)的關(guān)鍵參數(shù)或重要資 源進(jìn)行監(jiān)控和檢查, 了解系統(tǒng)運(yùn)行情況, 及時(shí)察覺(jué)系統(tǒng)可能的故障, 從而保證系 統(tǒng)的正常運(yùn)行, 提高系統(tǒng)可靠性。 應(yīng)用管理實(shí)現(xiàn)對(duì)各應(yīng)用系統(tǒng)的性能管理、 可靠 性管理、版本管理和數(shù)據(jù)管理。 性能管理包括對(duì)應(yīng)用系統(tǒng)性能的監(jiān)控和優(yōu)化; 可 靠性管理包括及時(shí)監(jiān)控應(yīng)用系統(tǒng)運(yùn)行情況, 及時(shí)發(fā)現(xiàn)潛在的問(wèn)題, 保證正常運(yùn)行; 版本管理包括對(duì)應(yīng)用系統(tǒng)的版本 /補(bǔ)丁的管理、發(fā)布及升級(jí),
4、配合相關(guān)部門(mén)進(jìn)行 應(yīng)用系統(tǒng)的相關(guān)測(cè)試、 試運(yùn)行和推廣; 數(shù)據(jù)管理包括按照有關(guān)規(guī)定及工作流程對(duì) 后臺(tái)數(shù)據(jù)必要的修改。
1.1.3 安全管理內(nèi)容
安全管理內(nèi)容: 安全管理對(duì)象包括網(wǎng)絡(luò)安全、 系統(tǒng)(主機(jī)系統(tǒng)、 數(shù)據(jù)庫(kù)系統(tǒng)、 中間件系統(tǒng)) 和應(yīng)用安全、 存儲(chǔ)備份安全。 管理內(nèi)容可分為安全管理制度的制定 和落實(shí)、安全設(shè)備的配置以及管理與監(jiān)控、安全管理故障的處理等。
1.1.4 存儲(chǔ)備份管理內(nèi)容
存儲(chǔ)備份系統(tǒng)運(yùn)行維護(hù)管理的主要內(nèi)容是備份策略管理、 備份軟件管理、 備 份數(shù)據(jù)管理及存儲(chǔ)硬件管理。備份策略的選擇,要統(tǒng)籌考慮需備份的總數(shù)據(jù)量、 線路帶寬、數(shù)據(jù)吞吐量、 時(shí)間窗口以及對(duì)恢復(fù)時(shí)間的要求等因素,
5、 根據(jù)不同業(yè)務(wù) 對(duì)數(shù)據(jù)備份的時(shí)間窗口和災(zāi)難恢復(fù)的要求, 選擇不同的備份方式, 亦可將幾種備 份方式組合應(yīng)用, 以得到最佳的備份效果。 數(shù)據(jù)管理包括數(shù)據(jù)的備份、 異地轉(zhuǎn)儲(chǔ)、 數(shù)據(jù)的歸檔和數(shù)據(jù)的識(shí)讀等。存儲(chǔ)硬件管理包括存儲(chǔ)網(wǎng)絡(luò)設(shè)備(如光纖交換機(jī) 等)、存儲(chǔ)設(shè)備及其相應(yīng)的管理軟件、備份設(shè)備及其備份軟件的日常維護(hù)及故障 處理、存儲(chǔ)設(shè)備容量管理。
1.1.5故障管理內(nèi)容
故障管理包括網(wǎng)絡(luò)、系統(tǒng)和應(yīng)用、安全、存儲(chǔ)備份的故障發(fā)現(xiàn)、故障分類、 故障轉(zhuǎn)發(fā)、故障診斷、故障處理、故障及處理記錄和統(tǒng)計(jì)等過(guò)程。
1.2制度
為確保運(yùn)行維護(hù)工作正常、有序、高質(zhì)地進(jìn)行,必須針對(duì)運(yùn)行維護(hù)的管理流 程和內(nèi)容,制定相應(yīng)的
6、運(yùn)行維護(hù)管理制度,實(shí)現(xiàn)各項(xiàng)工作的規(guī)范化管理。運(yùn)行維 護(hù)管理制度可分為:網(wǎng)絡(luò)管理制度、系統(tǒng)和應(yīng)用管理制度、安全管理制度、存儲(chǔ) 備份管理制度、故障管理制度、技術(shù)支持工具管理制度、人員管理制度和質(zhì)量考 核制度等。
網(wǎng)絡(luò)管理制度:包括網(wǎng)絡(luò)的準(zhǔn)入管理制度、網(wǎng)絡(luò)的配置管理制度、網(wǎng)絡(luò)的運(yùn) 行/監(jiān)控管理制度等。
系統(tǒng)和應(yīng)用管理制度:包括對(duì)主機(jī)、數(shù)據(jù)庫(kù)、中間件、應(yīng)用系統(tǒng)的配置管理 制度、運(yùn)行/監(jiān)控管理制度、數(shù)據(jù)管理制度等。
安全管理制度:包括網(wǎng)絡(luò)、主機(jī)、數(shù)據(jù)庫(kù)、中間件、應(yīng)用軟件、數(shù)據(jù)的安全
管理制度及安全事故應(yīng)急處理制度。
存儲(chǔ)備份管理制度:包括備份數(shù)據(jù)的管理制度和備份設(shè)備的管理制度。
故障管理制度
7、:包括對(duì)故障處理過(guò)程的管理制度、 故障處理流程的變更管理 制度、故障信息利用的管理制度及重大故障的應(yīng)急管理制度等。
1.3崗位職責(zé)
編號(hào)
崗位
一級(jí)
二級(jí)
三級(jí)
職責(zé)
1
網(wǎng)絡(luò)管理崗位
2
系統(tǒng)應(yīng)用管理
2.1
主機(jī)
2.2.
數(shù)據(jù)庫(kù)
2.3
中間件
3
安全管理
4
存儲(chǔ)備份
5
故障管理崗
一線支持人員主要負(fù)責(zé)可直接處理或可通過(guò)運(yùn)維知識(shí)庫(kù)查詢出處理辦法的 較簡(jiǎn)單問(wèn)題的解決。一線支持人員主要由本級(jí)受理平臺(tái)(呼叫中
8、心)人員組成。
二線支持人員主要負(fù)責(zé)解決一線支持無(wú)法解決的問(wèn)題, 二線支持人員由各系 統(tǒng)(包括各應(yīng)用系統(tǒng)、數(shù)據(jù)庫(kù)、中間件、主機(jī)、網(wǎng)絡(luò)、安全等)管理員組成,同 時(shí)還可包括PC服務(wù)外包商。
三線支持人員主要負(fù)責(zé)解決二線支持無(wú)法解決的問(wèn)題。三線支持人員由總局 運(yùn)行維護(hù)中心的高級(jí)技術(shù)支持人員、各種設(shè)備(包括主機(jī)、數(shù)據(jù)庫(kù)、中間件、網(wǎng) 絡(luò)等)的供應(yīng)商、各應(yīng)用系統(tǒng)軟件的開(kāi)發(fā)商等組成。
2日常尋檢
2.1機(jī)房設(shè)備巡檢
2.1.1機(jī)房?jī)?nèi)環(huán)境要求
溫度與濕度
最佳工作溫度
20-25攝氏度
極限工作溫
度:
10-40攝氏度
濕度
8-80%(在23攝氏度條件下)
電源要求
9、電壓范圍:
200-240V, 50-60HZ,
380 V
2.2 服務(wù)器系統(tǒng)檢查
2.2.1 服務(wù)器巡檢
2.2.2 錯(cuò)誤日志查看
2.2.3 文件系統(tǒng)查看
2.2.4 AIX 安全
2.2.5 Performance Tools
2.2.6 HACMP 巡檢
2.3 存儲(chǔ)設(shè)備巡檢
2.3.1 存儲(chǔ)設(shè)備巡檢
2.3.2 DS8300
2.3.2.1 健康檢查
每次 DS8300 磁盤(pán)陣列完成開(kāi)機(jī)后要進(jìn)行健康狀態(tài)檢查,在日常的維護(hù)工作中也需要定
期對(duì) DS8300 磁盤(pán)陣列的運(yùn)行狀況進(jìn)行健康狀態(tài)檢查。
2.3.2.2 日志信息查看
每次DS8300磁盤(pán)陣列完
10、成開(kāi)機(jī)后,如果“健康檢查”有個(gè)別選項(xiàng)不能通過(guò) (PASS),我 們就需要查看日志信息, 在日常的維護(hù)工作中也可以定期查看 DS8300 磁盤(pán)陣列的日志信息。
2.4 數(shù)據(jù)庫(kù)檢查
2.4.1 檢查 CRS 狀態(tài)
2.4.2 檢查監(jiān)聽(tīng)是否正常運(yùn)行
2.4.3 檢查實(shí)例是否啟動(dòng)
2.4.4 檢查數(shù)據(jù)庫(kù)報(bào)警日志
2.5 BEA 應(yīng)用服務(wù)器檢查
2.5.1 檢查 JAVA 進(jìn)程
2.5.2 Weblogic server 狀態(tài)檢查
2.6 網(wǎng)絡(luò)安全
3 故障處理
3.1 故障處理流程
為高效、優(yōu)質(zhì)地完成故障處理, 必須對(duì)可能出現(xiàn)的故障進(jìn)行級(jí)別劃分, 根據(jù)
級(jí)別的不同,確定相應(yīng)的響應(yīng)處理方式。故障級(jí)別可劃分為如下四級(jí):
一級(jí)故障:系統(tǒng)癱瘓或服務(wù)中斷, 導(dǎo)致系統(tǒng)的基本功能不能實(shí)現(xiàn)或全面退化 的故障。
二級(jí)故障:出現(xiàn)的故障具有潛在的系統(tǒng)癱瘓或服務(wù)中斷的危險(xiǎn), 并可能導(dǎo)致 系統(tǒng)的基本功能不能實(shí)現(xiàn)或全面退化。
三級(jí)故障:主要指系統(tǒng)在運(yùn)行中出現(xiàn)的直接影響服務(wù), 導(dǎo)致系統(tǒng)性能或服務(wù) 部分退化的故障。
四級(jí)故障:主要指系統(tǒng)在運(yùn)行中出現(xiàn)的,斷續(xù)或間接地影響系統(tǒng)功能和服務(wù) 的故障。
故障處理流程圖如下: