數(shù)據(jù)庫(kù)技術(shù)方案.doc
廣西區(qū)質(zhì)量技術(shù)監(jiān)督局?jǐn)?shù)據(jù)庫(kù)維保服務(wù)方案南寧秦唐科技有限公司2016年8月目錄廣西區(qū)質(zhì)量技術(shù)監(jiān)督局?jǐn)?shù)據(jù)庫(kù)1維保服務(wù)方案11項(xiàng)目背景及目標(biāo)31.1項(xiàng)目背景31.2項(xiàng)目目標(biāo)32需求分析33維保范圍44數(shù)據(jù)庫(kù)維保方案54.1系統(tǒng)健康狀態(tài)檢查54.1.1Oracle數(shù)據(jù)庫(kù)運(yùn)維主要核查項(xiàng)54.1.2Mysql數(shù)據(jù)庫(kù)運(yùn)維主要檢查項(xiàng)94.1.3SqlServer數(shù)據(jù)庫(kù)運(yùn)維主機(jī)檢查項(xiàng)104.2數(shù)據(jù)庫(kù)性能分析與優(yōu)化調(diào)整104.3數(shù)據(jù)庫(kù)備份以及恢復(fù)服務(wù)114.4數(shù)據(jù)庫(kù)補(bǔ)丁分析與安裝124.57*24小時(shí)數(shù)據(jù)庫(kù)救援服務(wù)125技術(shù)支持以及服務(wù)體系135.1故障處理要求135.2重大活動(dòng)現(xiàn)場(chǎng)護(hù)航135.3維護(hù)作業(yè)計(jì)劃145.4信息安全保障145.5第三方協(xié)助服務(wù)145.6服務(wù)質(zhì)量分析146項(xiàng)目實(shí)施以及管理156.1項(xiàng)目實(shí)施策略156.2項(xiàng)目實(shí)施計(jì)劃156.3項(xiàng)目交付文檔156.4交付要求156.5提交文件資料161 項(xiàng)目背景及目標(biāo)1.1 項(xiàng)目背景廣西區(qū)質(zhì)量技術(shù)監(jiān)督局信息化建設(shè)經(jīng)過多年的發(fā)展和完善,已經(jīng)建立成熟的網(wǎng)絡(luò)環(huán)境及生產(chǎn)經(jīng)營(yíng)管理的各類應(yīng)用系統(tǒng),目前質(zhì)監(jiān)局擁有多套不同類型的數(shù)據(jù)庫(kù)(多種操作系統(tǒng))混合使用(Oracle,Mysql,SqlServer),共十幾個(gè)節(jié)點(diǎn),其中最大的oracle生產(chǎn)數(shù)據(jù)庫(kù)已高達(dá)3TB;隨著質(zhì)監(jiān)工作的業(yè)務(wù)發(fā)展,各系統(tǒng)數(shù)據(jù)量逐年增加 ,作為業(yè)務(wù)核心的數(shù)據(jù)庫(kù),安全性,可靠性的要求也變得越來越高, 需要更加專業(yè)細(xì)致地對(duì)數(shù)據(jù)庫(kù)維護(hù),以便更好地為全區(qū)質(zhì)監(jiān)工作提供IT服務(wù)。1.2 項(xiàng)目目標(biāo)通過建立規(guī)范的維護(hù)作業(yè)體系,及時(shí)發(fā)現(xiàn)數(shù)據(jù)庫(kù)運(yùn)行中的風(fēng)險(xiǎn)問題,防患于未然,保障數(shù)據(jù)庫(kù)運(yùn)行健康持續(xù)。對(duì)數(shù)據(jù)庫(kù)運(yùn)行性能進(jìn)行監(jiān)測(cè)分析,及時(shí)發(fā)現(xiàn)瓶頸,通過外部資源調(diào)優(yōu)、行的重新安排調(diào)優(yōu)、SQL 性能調(diào)優(yōu)、表格和索引存儲(chǔ)參數(shù)設(shè)置調(diào)優(yōu)等方式,及時(shí)對(duì)性能問題進(jìn)行處理,保障數(shù)據(jù)庫(kù)穩(wěn)定高效工作;對(duì)各個(gè)系統(tǒng)數(shù)據(jù)庫(kù)進(jìn)行補(bǔ)丁升級(jí)服務(wù),安裝補(bǔ)丁前需要對(duì)補(bǔ)丁的可行性及風(fēng)險(xiǎn)性進(jìn)行分析,并制定升級(jí)計(jì)劃和應(yīng)急回退計(jì)劃。同時(shí)要做好系統(tǒng)備份準(zhǔn)備及詳細(xì)的測(cè)試工作,確保系統(tǒng)的穩(wěn)定性、安全性,保障系統(tǒng)業(yè)務(wù)數(shù)據(jù)的安全;2 需求分析廣西區(qū)質(zhì)量技術(shù)監(jiān)督局項(xiàng)目現(xiàn)場(chǎng)多種數(shù)據(jù)庫(kù)共存,相互為多個(gè)應(yīng)用系統(tǒng)服務(wù)。為保證數(shù)據(jù)庫(kù)系統(tǒng)的穩(wěn)定、安全、合理和高效,減低故障對(duì)生產(chǎn)的影響,消除生產(chǎn)故障的薄弱環(huán)節(jié),現(xiàn)需購(gòu)買對(duì)以下數(shù)據(jù)庫(kù)的保修和維護(hù)服務(wù)。ID數(shù)據(jù)庫(kù)節(jié)點(diǎn)數(shù)據(jù)庫(kù)類型應(yīng)用說明保障級(jí)別1oracle rac 雙節(jié)點(diǎn)(HP主機(jī))oracle10g金質(zhì)工程核心數(shù)據(jù)庫(kù)重要2oracle rac 雙節(jié)點(diǎn)(Linux)oracle10g金質(zhì)工程核心數(shù)據(jù)庫(kù)重要3Oracle 單節(jié)點(diǎn)Oracle 10g邊界交換數(shù)據(jù)庫(kù)重要4Oracle 單節(jié)點(diǎn)Oracle 10g云平臺(tái)數(shù)據(jù)庫(kù)(內(nèi)網(wǎng))重要5Oracle 單節(jié)點(diǎn)Oracle 10g云平臺(tái)數(shù)據(jù)庫(kù)(外網(wǎng))重要6SQL SERVER MSCS1mssql server2008外部門戶數(shù)據(jù)庫(kù)重要7SQL SERVER MSCS2mssql server2008外部門戶數(shù)據(jù)庫(kù)重要8SQL SERVER MSCS3mssql server2008OA考核重要10SQL SERVER MSCS4mssql server2008重要11mysql 集群1普通12mysql 集群2普通3 維保范圍1) 提供常態(tài)化服務(wù)和技術(shù)支持,并配備資深工程師,工程師熟悉oracle/sqlserver/mysql等各種主流數(shù)據(jù)庫(kù)技術(shù),保證能快速、有效的解決各類故障。 2) 配置和優(yōu)化系統(tǒng)安全、加固,故障的診斷與排除等。3) 數(shù)據(jù)庫(kù)系統(tǒng)恢復(fù)服務(wù),確保系統(tǒng)崩潰后的快速恢復(fù)。4) 為客戶提供各個(gè)版本數(shù)據(jù)庫(kù)系統(tǒng)運(yùn)行和維護(hù)的合理建議。5) 數(shù)據(jù)庫(kù)系統(tǒng)軟件升級(jí)(用戶要求)和不限次(或配合用戶)安裝。6) 對(duì)數(shù)據(jù)庫(kù)系統(tǒng)本身存在的安全隱患和安全問題,進(jìn)行修復(fù);對(duì)系統(tǒng)配置和數(shù)據(jù)定期備份7) 提供系統(tǒng)維修及維護(hù)報(bào)告。4 數(shù)據(jù)庫(kù)維保方案數(shù)據(jù)庫(kù)維保工作主要包括: 數(shù)據(jù)庫(kù)健康狀態(tài)檢查、數(shù)據(jù)庫(kù)性能分析與調(diào)整、數(shù)據(jù)庫(kù)備份與恢復(fù)、數(shù)據(jù)庫(kù)補(bǔ)丁分析與安裝、7*24小時(shí)數(shù)據(jù)庫(kù)救援等工作。4.1 系統(tǒng)健康狀態(tài)檢查檢查內(nèi)容包括 : Oracle數(shù)據(jù)庫(kù)和CRS錯(cuò)誤日志和分析 ; 文件系統(tǒng)空間使用情況檢查; Oracle數(shù)據(jù)庫(kù)及RAC系統(tǒng)運(yùn)行情況狀態(tài)、性能分析和優(yōu)化建議; 檢查其OS狀況,包括CPU、內(nèi)存和交換區(qū)使用情況,硬盤和網(wǎng)絡(luò)的IO情況檢查; 記錄Oracle數(shù)據(jù)庫(kù)存儲(chǔ)空間的邏輯結(jié)構(gòu); Oracle 數(shù)據(jù)庫(kù)備份情況檢查;等根據(jù)檢查結(jié)果分析并給出數(shù)據(jù)庫(kù)可行的調(diào)整建議和實(shí)施;每月至少進(jìn)行一次系統(tǒng)健康狀態(tài)的檢查, 根據(jù)制定的維保服務(wù)內(nèi)容和流程對(duì)Oracle、Mysql,SqlServer進(jìn)行一次全面巡檢,包括檢查數(shù)據(jù)庫(kù)設(shè)備、系統(tǒng)的運(yùn)行情況 ; 每月25日之前提供數(shù)據(jù)庫(kù)巡檢報(bào)告 。4.1.1 Oracle數(shù)據(jù)庫(kù)運(yùn)維主要核查項(xiàng)數(shù)據(jù)庫(kù)的運(yùn)維主要結(jié)合廣西質(zhì)量技術(shù)監(jiān)督局的實(shí)際情況,提供切實(shí)可行的運(yùn)維建設(shè)機(jī)制,內(nèi)容覆蓋 ORACLE 數(shù)據(jù)庫(kù)的日常維護(hù)、緊急故障處理,軟件升級(jí)等,客戶可依據(jù)服務(wù)內(nèi)容進(jìn)行相應(yīng)的定制。我們將會(huì)提供全面的、針對(duì)性的服務(wù)解決方案,以??蛻粝到y(tǒng)穩(wěn)定、高效、可靠的運(yùn)行,以達(dá)到對(duì)業(yè)務(wù)系統(tǒng)的有效支持。4.1.1.1 檢查數(shù)據(jù)庫(kù)cpu、I/O、內(nèi)存性能記錄數(shù)據(jù)庫(kù)的cpu使用、IO、內(nèi)存等使用情況,使用vmstat,iostat,sar,top等命令進(jìn)行信息收集并檢查這些信息,判斷資源使用情況。4.1.1.2 檢查rman備份的有效性restore preview/restore database preview命令此命令用來查看還原需要使用哪個(gè)備份集來執(zhí)行特定的恢復(fù)使用validate和check logical參數(shù)的restore命令,檢查備份集,以確認(rèn)數(shù)據(jù)庫(kù)是可恢復(fù)的restore database validate;使用check logical參數(shù)可以更完全的檢查最新備份集runrestore database check logical validate;使用validate backupset命令使用具有validate參數(shù)或check logical參數(shù)的restore命令只能檢查最新的備份集,如果要檢查任意的備份集,就需要用validate backupset命令。首先必須確認(rèn)要檢查的備份集的鍵(backup set key)list backupset;再執(zhí)行檢查validate backupset 141;或validate backupset 141 check logical;4.1.1.3 檢查oracle數(shù)據(jù)庫(kù)集群運(yùn)行狀況用crs_statt命令檢查oracle數(shù)據(jù)庫(kù)的幾個(gè)集群模塊是否有offline的4.1.1.4 檢查數(shù)據(jù)庫(kù)的Alert.log日志,是否有ora錯(cuò)誤對(duì)每個(gè)數(shù)據(jù)庫(kù),cd 到bdump目錄,通常是$ORACLE_BASE/admin/<SID>/bdump查看最新時(shí)候有ora錯(cuò)誤,找出來分析4.1.1.5 收集每個(gè)數(shù)據(jù)庫(kù)的AWR報(bào)告,根據(jù)報(bào)告內(nèi)容,優(yōu)化數(shù)據(jù)庫(kù)排查是否存在影響系統(tǒng)性能的等待事件、top 5 SQL、硬解析是否太高、緩沖區(qū)命中率是否高4.1.1.6 檢查ASM磁盤組空間是否足夠select instance_name,host_name,startup_time,status,database_status from gv$instance;確保數(shù)據(jù)磁盤組有足夠的空間給數(shù)據(jù)庫(kù)使用,如果是用于歸檔日志用的ASM磁盤組空間滿,必須及時(shí)用rman備份并刪除舊的歸檔日志。4.1.1.7 檢查各個(gè)數(shù)據(jù)庫(kù)操作系統(tǒng)的磁盤空間利用率dfh或者dfm文件系統(tǒng)空間使用率超過80%,必須要清理磁盤無用的文件或者日志4.1.1.8 檢查數(shù)據(jù)庫(kù)各個(gè)節(jié)點(diǎn)都處于讀寫模式select name,log_mode,open_mode from gv$database;各個(gè)節(jié)點(diǎn)都正常,數(shù)據(jù)庫(kù)才能實(shí)現(xiàn)負(fù)載均衡和失敗切換的功能4.1.1.9 查看表空間使用率,及時(shí)添加數(shù)據(jù)文件SELECT UPPER(F.TABLESPACE_NAME) "表空間名", D.TOT_GROOTTE_MB "表空間大小(M)", D.TOT_GROOTTE_MB - F.TOTAL_BYTES "已使用空間(M)", TO_CHAR(ROUND(D.TOT_GROOTTE_MB - F.TOTAL_BYTES) / D.TOT_GROOTTE_MB * 100, 2), 990.99) "使用比", F.TOTAL_BYTES "空閑空間(M)", F.MAX_BYTES "最大塊(M)" FROM (SELECT TABLESPACE_NAME, ROUND(SUM(BYTES) / (1024 * 1024), 2) TOTAL_BYTES, ROUND(MAX(BYTES) / (1024 * 1024), 2) MAX_BYTES FROM SYS.DBA_FREE_SPACE GROUP BY TABLESPACE_NAME) F, (SELECT DD.TABLESPACE_NAME, ROUND(SUM(DD.BYTES) / (1024 * 1024), 2) TOT_GROOTTE_MB FROM SYS.DBA_DATA_FILES DD GROUP BY DD.TABLESPACE_NAME) D WHERE D.TABLESPACE_NAME = F.TABLESPACE_NAME ORDER BY 4 DESC;密切關(guān)注各個(gè)表空間使用情況,使用率查過85%以上的,要及時(shí)添加數(shù)據(jù)文件到表空間,并與上個(gè)月巡檢結(jié)果對(duì)比,估算主要業(yè)務(wù)表空間增長(zhǎng)增長(zhǎng)情況,一次性添加做過數(shù)據(jù)文件4.1.1.10 檢查失效的索引Select * fromdba_indexeswherestatus=UNUSABLE;如果有失效索引,alter index index_name rebuild online在線重建。4.1.1.11 檢查大表,分析是否需要轉(zhuǎn)換成分區(qū)表存放SELECT SEGMENT_NAME, ROUND(SUM(BYTES) / 1024 / 1024 / 1024, 2) G FROM DBA_SEGMENTS WHERE OWNER NOT IN (SYS, SYSTEM) AND segment_type NOT IN (INDEX, INDEX PARTITION, INDEX SUBPARTITION) GROUP BY SEGMENT_NAME ORDER BY G DESC;對(duì)于日志大表,建議改造成采用按時(shí)間分區(qū)的分區(qū)表,提升數(shù)據(jù)庫(kù)讀寫效率。4.1.1.12 檢查oracle每個(gè)實(shí)例的的實(shí)際連接數(shù)和數(shù)據(jù)庫(kù)配置的連接數(shù)Select count(1) from v$session; -實(shí)際連接的session數(shù)量show parameter session;如果實(shí)際連接的session連接數(shù)快要達(dá)到系統(tǒng)配置的session數(shù)量,需要增加session的數(shù)量,以免有業(yè)務(wù)無法正常連接數(shù)據(jù)庫(kù)4.1.1.13 檢查數(shù)據(jù)庫(kù)運(yùn)行慢的SQLSELECT USERNAME, SID, OPNAME, ROUND(SOFAR * 100 / TOTALWORK, 0) | % AS PROGRESS, TIME_REMAINING, SQL_TEXT FROM V$SESSION_LONGOPS, V$SQL WHERE TIME_REMAINING <> 0 AND SQL_ADDRESS = ADDRESS AND SQL_HASH_VALUE = HASH_VALUE;4.1.1.14 檢查占用CPU比較多的SQLSELECT P.PID PID, S.SID SID, P.SPID SPID, S.USERNAME USERNAME, S.OSUSER OSNAME, P.SERIAL# S_#, P.TERMINAL, P.PROGRAM PROGRAM, P.BACKGROUND, S.STATUS, RTRIM(SUBSTR(A.SQL_TEXT, 1, 80) SQLFROM V$PROCESS P, V$SESSION S, V$SQLAREA A WHERE P.ADDR = S.PADDR AND S.SQL_ADDRESS = A.ADDRESS(+) AND P.SPID LIKE %&1%;4.1.1.15 檢查最消耗內(nèi)存資源的SQLselect b.pga_alloc_mem / 1024 / 1024, a.* from v$session a, v$process b where a.PADDR = b.addr and pga_alloc_mem / 1024 / 1024 > 100;4.1.2 Mysql數(shù)據(jù)庫(kù)運(yùn)維主要檢查項(xiàng)4.1.2.1 檢查數(shù)據(jù)庫(kù)備份是否正常檢查是否有備份機(jī)制,已有備份機(jī)制,且最后一個(gè)備份成功為正常4.1.2.2 檢查數(shù)據(jù)庫(kù)后臺(tái)日志,最近是否有error錯(cuò)誤檢查data目錄下host_name.err近期是否有錯(cuò)誤4.1.2.3 檢查MySQL數(shù)據(jù)庫(kù)連接統(tǒng)計(jì)showstatus;檢查Aborted_clients由于客戶沒有正確關(guān)閉連接已經(jīng)死掉,已經(jīng)放棄的連接數(shù)量。Aborted_connects嘗試已經(jīng)失敗的MySQL服務(wù)器的連接的次數(shù)。Threads_connected當(dāng)前打開的連接的數(shù)量。Max_used_connections同時(shí)使用的連接的最大數(shù)目以Max_used_connections遠(yuǎn)小于my.cnf中的最大連接數(shù)目則正常。如果接近則考慮增大最大數(shù)目。4.1.2.4 檢查MySQL數(shù)據(jù)庫(kù)表鎖統(tǒng)計(jì)(包括立即鎖及等待鎖)showstatusliketable%;如果waited的數(shù)值比較高,說明數(shù)據(jù)庫(kù)鎖爭(zhēng)用比較嚴(yán)重4.1.2.5 主庫(kù)查看狀態(tài)Show master status4.1.2.6 查詢從服務(wù)器狀態(tài)Show slave status,經(jīng)常檢查從服務(wù)器的復(fù)制狀態(tài),防止復(fù)制過程中出現(xiàn)故障從而導(dǎo)致進(jìn)程停止4.1.2.7 Mysql連接數(shù)排查Show variables like %max_connectins%Show gloable status like max_use_connections當(dāng)前數(shù)據(jù)庫(kù)已經(jīng)使用的最大連接數(shù)不能超過閥值4.1.2.8 Mysql文件打開數(shù)檢查Show global status like open_files;Show variables like open_files_limit打開數(shù)量要小于limit值4.1.3 SqlServer數(shù)據(jù)庫(kù)運(yùn)維主機(jī)檢查項(xiàng)4.1.3.1 檢查數(shù)據(jù)庫(kù)自動(dòng)備份是否正常檢查是否有備份機(jī)制,以有備份機(jī)制,且最后一個(gè)備份成功為正常4.1.3.2 驗(yàn)證備份集驗(yàn)證備份集(RESTORE VERIFYONLY )4.1.3.3 檢查數(shù)據(jù)庫(kù)集群是否能正常工作4.1.3.4 檢查磁盤空間是否足夠檢查數(shù)據(jù)文件所在的磁盤空間使用情況檢查日志文件所在的磁盤空間使用情況檢查備份的磁盤空間使用情況4.1.3.5 檢查系統(tǒng)日志使用“事件查看器”,查看系統(tǒng)日志,關(guān)注錯(cuò)誤信息排查錯(cuò)誤。重點(diǎn)關(guān)注與SQLServer相關(guān)的日志信息。及時(shí)備份與清理過期的日志信息。4.2 數(shù)據(jù)庫(kù)性能分析與優(yōu)化調(diào)整根據(jù)用戶需要進(jìn)行數(shù)據(jù)庫(kù)的性能分析,針對(duì)發(fā)現(xiàn)的問題提出合理的解決方案 ;每月巡檢中包含對(duì)數(shù)據(jù)庫(kù)運(yùn)行性能的分析。主要包括:數(shù)據(jù)庫(kù)性能的監(jiān)控和調(diào)整、系統(tǒng)資源的監(jiān)控及管理 。如:l 優(yōu)化服務(wù)器配置根據(jù)現(xiàn)有硬件配置及用戶訪問量及服務(wù)器性能指標(biāo),確定是否存在系統(tǒng)(cpu,內(nèi)存,硬盤)瓶頸及數(shù)據(jù)庫(kù)配置問題,提出解決瓶頸的方法及建議。l 優(yōu)化應(yīng)用程序根據(jù)應(yīng)用程序配置,確定是否存在應(yīng)用程序問題使系統(tǒng)運(yùn)行緩慢,提出應(yīng)用程序優(yōu)化建議(如:負(fù)載均衡)。l 數(shù)據(jù)庫(kù)及應(yīng)用程序整合分析數(shù)據(jù)庫(kù)與應(yīng)用布局是否合理,提出整合建議。l 數(shù)據(jù)庫(kù)參數(shù)調(diào)整優(yōu)化參數(shù),使數(shù)據(jù)庫(kù)在最優(yōu)的環(huán)境下運(yùn)行。l 數(shù)據(jù)庫(kù)潛在重要問題數(shù)據(jù)庫(kù)是否存在潛在問題,對(duì)數(shù)據(jù)庫(kù)有什么重要的影響, 或深圳廣西質(zhì)量技術(shù)監(jiān)督局方面認(rèn)為緊急的。l 優(yōu)化內(nèi)存配置與系統(tǒng)后臺(tái)進(jìn)程l 優(yōu)化物理文件的存放,對(duì)大型數(shù)據(jù)庫(kù)考慮用磁盤陣列柜存放l 優(yōu)化數(shù)據(jù)庫(kù)邏輯結(jié)構(gòu)優(yōu)化表空間、臨時(shí)表空間、回滾段l 優(yōu)化數(shù)據(jù)庫(kù)對(duì)象優(yōu)化表結(jié)構(gòu)、建立分區(qū)表,優(yōu)化索引結(jié)構(gòu)、更新統(tǒng)計(jì)信息l 優(yōu)化SQL語(yǔ)句查詢運(yùn)行慢的SQL語(yǔ)句,并給出優(yōu)化建議l 提供數(shù)據(jù)庫(kù)優(yōu)化方案及實(shí)施方案、報(bào)告等4.3 數(shù)據(jù)庫(kù)備份以及恢復(fù)服務(wù)根據(jù)現(xiàn)場(chǎng)情況,制定合理的備份計(jì)劃,定期備份各個(gè)數(shù)據(jù)庫(kù)。具備條件的情況下,要定期對(duì)備份集進(jìn)行異機(jī)恢復(fù),測(cè)試備份集是否可用。數(shù)據(jù)庫(kù)發(fā)生重大故障時(shí)(如磁盤陣列故障導(dǎo)致的數(shù)據(jù)庫(kù)癱瘓),以最快的速度從備份系統(tǒng)中恢復(fù)數(shù)據(jù),并使系統(tǒng)能夠在最短的時(shí)間內(nèi)恢復(fù)正常運(yùn)行。4.4 數(shù)據(jù)庫(kù)補(bǔ)丁分析與安裝根據(jù)用戶需要提供相關(guān)系統(tǒng)軟件升級(jí)服務(wù);當(dāng)數(shù)據(jù)庫(kù)ORACLE、MYSQL、SQLSERVER軟件有最新更新升級(jí)時(shí),維保方須及時(shí)通知廣西質(zhì)量技術(shù)監(jiān)督局,并根據(jù)廣西質(zhì)量技術(shù)監(jiān)督局的要求和安排到現(xiàn)場(chǎng)進(jìn)行更新升級(jí)(每年一般不超過兩次)。4.5 7*24小時(shí)數(shù)據(jù)庫(kù)救援服務(wù)提供724小時(shí)應(yīng)急響應(yīng)熱線,由具有豐富工作經(jīng)驗(yàn)的資深OCP認(rèn)證工程師 在用戶的Oracle產(chǎn)品出現(xiàn)重大故障時(shí)提供現(xiàn)場(chǎng)緊急救援服務(wù)。重大故障包括: OS故障,導(dǎo)致Oracle不能正常啟動(dòng)或運(yùn)行 硬件故障(包括CPU、硬盤等),導(dǎo)致數(shù)據(jù)庫(kù)崩潰 人為故障,包括維護(hù)人員不小心刪除數(shù)據(jù)庫(kù)文件,或人為將Table中的數(shù)據(jù)刪除等等 導(dǎo)致數(shù)據(jù)庫(kù)不能正常運(yùn)行的情況,如控制文件遭破壞,Redo Log文件遭破壞,數(shù)據(jù)文件遭破壞等等 其他故障,包括影響數(shù)據(jù)庫(kù)正常運(yùn)行的各類緊急故障5 技術(shù)支持以及服務(wù)體系5.1 故障處理要求25分鐘內(nèi)故障處理電話響應(yīng)服務(wù),故障服務(wù)的現(xiàn)場(chǎng)響應(yīng)時(shí)間小于1小時(shí),即1小時(shí)內(nèi)有能夠處理故障的技術(shù)人員到達(dá)現(xiàn)場(chǎng),并立即投入對(duì)故障的處理,并能夠在2個(gè)小時(shí)內(nèi)恢復(fù)故障系統(tǒng)的正常運(yùn)行。如果用戶的問題不能通過電話解決,客戶服務(wù)部會(huì)立刻派經(jīng)驗(yàn)豐富的工程師到現(xiàn)場(chǎng)為用戶解決問題,客戶服務(wù)人員對(duì)解決的過程進(jìn)行記錄,并向用戶提供解決問題的報(bào)告包括問題原因、解決方法、解決問題的方式和進(jìn)程,以及建議用戶對(duì)系統(tǒng)進(jìn)行正常使用的指導(dǎo)和培訓(xùn)問題解決后需要用戶進(jìn)行確認(rèn)。5.2 重大活動(dòng)現(xiàn)場(chǎng)護(hù)航敏感時(shí)期、重大節(jié)假日、領(lǐng)導(dǎo)巡查,維護(hù)技術(shù)原因提前入場(chǎng)做詳細(xì)巡檢,并于活動(dòng)時(shí)間段內(nèi)入駐客戶駐地,提供5*8小時(shí)的現(xiàn)場(chǎng)保障服務(wù) 。在國(guó)家節(jié)假日期間前一個(gè)星期, 提供節(jié)日值班表,包含: 當(dāng)日負(fù)責(zé)人姓名及聯(lián)系電話、反應(yīng)時(shí)間、到現(xiàn)場(chǎng)時(shí)間、處理好時(shí)間 等內(nèi)容。 以發(fā)電子郵件方式告知客戶負(fù)責(zé)人。5.3 維護(hù)作業(yè)計(jì)劃為保障數(shù)據(jù)庫(kù)系統(tǒng)的長(zhǎng)效運(yùn)行。我們制定 日、周、月 的檢查內(nèi)容,通過 自動(dòng)、遠(yuǎn)程、現(xiàn)場(chǎng)相結(jié)合的方式,形成日常作業(yè)計(jì)劃,對(duì)數(shù)據(jù)庫(kù)運(yùn)行情況檢查,及早發(fā)現(xiàn)問題和處理問題。如:每日的數(shù)據(jù)庫(kù)表自動(dòng)分析、每周的遠(yuǎn)程備份情況檢查、每月的現(xiàn)場(chǎng)設(shè)備檢查等 。5.4 信息安全保障系統(tǒng)的安全性是業(yè)務(wù)正常運(yùn)行的保障,其重要性不言而喻。我公司會(huì)根據(jù)標(biāo)準(zhǔn)的安全規(guī)范和成功經(jīng)驗(yàn),為用戶的系統(tǒng)進(jìn)行安全性檢查,包括文件權(quán)限的設(shè)置、用戶訪問的限制、增補(bǔ)軟件的更新等技術(shù)方面,同時(shí)對(duì)系統(tǒng)安全策略進(jìn)行評(píng)估,將發(fā)現(xiàn)的問題隱患及改進(jìn)建議以報(bào)告的形式提交給用戶。通過系統(tǒng)安全性檢查,可以提高系統(tǒng)的安全級(jí)別,防止系統(tǒng)遭到惡性攻擊口。5.5 第三方協(xié)助服務(wù)協(xié)助用戶或第三方完成對(duì)系統(tǒng)設(shè)備、軟件的維護(hù)、升級(jí)、擴(kuò)容等技術(shù)支持工作,確??蛻羯a(chǎn)系統(tǒng)的安全平穩(wěn)運(yùn)行。5.6 服務(wù)質(zhì)量分析提供每月1次對(duì)oracle、sqlserver、mysql全面巡檢服務(wù),對(duì)維保范圍系統(tǒng)進(jìn)行細(xì)致全面地監(jiān)視、檢查、隱患排除等。并按照用戶要求提供特殊時(shí)段保障要求的巡檢。每月提交月度服務(wù)報(bào)告、包括并不限于服務(wù)天數(shù)、次數(shù)、電話接通延遲時(shí)間、報(bào)修故障及原因、恢復(fù)措施報(bào)告等定量數(shù)據(jù);根據(jù)用戶需要召開服務(wù)質(zhì)量分析例會(huì),對(duì)該階段服務(wù)進(jìn)行總結(jié)。并對(duì)例會(huì)紀(jì)要中的意見與建議部分于7日內(nèi)反饋并跟蹤落實(shí)。 工程師將在巡檢后進(jìn)行日志分析,及時(shí)發(fā)現(xiàn)潛在故障隱患以及系統(tǒng)錯(cuò)誤日志,并提供巡檢報(bào)告一冊(cè),巡檢報(bào)告內(nèi)容包括設(shè)備運(yùn)行狀態(tài)、錯(cuò)誤日志、以及針對(duì)問題的優(yōu)化建議等。6 項(xiàng)目實(shí)施以及管理6.1 項(xiàng)目實(shí)施策略項(xiàng)目的實(shí)施成功與否主要表現(xiàn)為“兩個(gè)機(jī)制、一個(gè)測(cè)試”:順暢溝通機(jī)制和技術(shù)轉(zhuǎn)移機(jī)制、模擬測(cè)試。順暢溝通機(jī)制:建立和用戶方的良好順暢的協(xié)調(diào)機(jī)制;技術(shù)轉(zhuǎn)移機(jī)制:系統(tǒng)在移交后,日常的管理工作有比較大的專業(yè)性,成功的技術(shù)轉(zhuǎn)移是以后系統(tǒng)良好運(yùn)作的前提和保證。建議用戶方的技術(shù)牽頭人和系統(tǒng)管理員對(duì)項(xiàng)目的全程深入?yún)⑴c。模擬測(cè)試:通過在模擬環(huán)境完成系統(tǒng)調(diào)試后并在真實(shí)環(huán)境完成試運(yùn)行測(cè)試。因而在本次Oralce日常運(yùn)行維護(hù)服務(wù)的過程中,我公司將按照軟件項(xiàng)目實(shí)施的策略來進(jìn)行管理,從而保證整個(gè)項(xiàng)目的維護(hù)就如同開發(fā)過程一樣嚴(yán)格管理。6.2 項(xiàng)目實(shí)施計(jì)劃ORACLE 產(chǎn)品日常運(yùn)行維護(hù)年度服務(wù)項(xiàng)目是一個(gè)長(zhǎng)期的優(yōu)化維護(hù)項(xiàng)目,我公司根據(jù)多年的開發(fā)維護(hù)經(jīng)驗(yàn)可分為兩個(gè)階段。第一個(gè)階段為優(yōu)化實(shí)施階段,包括各個(gè)應(yīng)用系統(tǒng)的環(huán)境情況調(diào)查,應(yīng)用系統(tǒng)的統(tǒng)計(jì)登記、數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)化等。第二個(gè)階段為運(yùn)維階段,主要包括相關(guān)應(yīng)用的培訓(xùn),數(shù)據(jù)庫(kù)管理培訓(xùn)、數(shù)據(jù)庫(kù)備份恢復(fù)的培訓(xùn)以及后期系統(tǒng)運(yùn)維、檢查等保護(hù)措施,定期對(duì)全廠數(shù)據(jù)庫(kù)及系統(tǒng)進(jìn)行巡檢,巡檢內(nèi)容包括:系統(tǒng)日志、網(wǎng)絡(luò)狀況、系統(tǒng)空間狀況、存儲(chǔ)設(shè)備狀態(tài)、系統(tǒng)性能、產(chǎn)品參數(shù)與配置、數(shù)據(jù)庫(kù)各種文件的狀態(tài)與配置、數(shù)據(jù)庫(kù)安全審計(jì)、數(shù)據(jù)對(duì)象配置的合理性、實(shí)例的運(yùn)行效率、SQL 代碼性能調(diào)優(yōu)等。6.3 項(xiàng)目交付文檔6.4 交付要求我公司提供的資料將使用國(guó)家法定單位制即國(guó)際單位制,語(yǔ)言為中文。提供的紙介質(zhì)文件時(shí)需同時(shí)提供 Office 電子版文件。資料的組織結(jié)構(gòu)清晰、邏輯性強(qiáng)。資料內(nèi)容正確、準(zhǔn)確、一致、清晰完整,滿足項(xiàng)目要求。6.5 提交文件資料文檔的內(nèi)容至少包括系統(tǒng)的維護(hù)手冊(cè)、數(shù)據(jù)庫(kù)定期巡檢記錄、數(shù)據(jù)庫(kù)日常運(yùn)維手冊(cè)、文檔介質(zhì)包括: 系統(tǒng)信息表 數(shù)據(jù)庫(kù)日常運(yùn)維手冊(cè) 數(shù)據(jù)庫(kù)定期巡檢記錄表 應(yīng)用系統(tǒng)巡檢記錄 其他相關(guān)的技術(shù)資料