故障应急预案(精选3篇)由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“网站故障应急预案”。
第1篇:软件故障应急预案
软件故障应急预案
【篇1:信息系统应急处理预案】
信息系统应急处理预案
第一章 总 则
第一条 为提高应对信息系统在运行过程中出现的各种突发事件的应急处臵能力,有效预防和最大程度地降低信息系统各类突发事件的危害和影响,保障信息系统安全、稳定运行,根据国家《信息安全事件分类分级指南》、《信息技术、安全技术、信息安全事件管理指南》、《国家突发公共事件总体应急预案》及有关法律、法规的规定,结合实际,制定本处理预案。
第三条 信息系统突发事件分为网络攻击事件、信息破坏事件、信息内容安全事件、网络故障事件、软件系统故障事件、灾难性事情、其他事件等八类事件。
(一)网络攻击事件:通过网络或其他技术手段,利用信息系统的配臵缺陷、协议缺陷、程序缺陷或使用暴力攻击对信息系统实施攻击,并造成信息系统异常或对信息系统当前运行造成潜在危害的事件。
(二)信息破坏事件:通过网络或其他技术手段,造成信息系统中的数据被篡改、假冒、泄漏等而导致的事件。
(三)信息内容安全事件:利用信息网络发布、传播危害国家安全、社会稳定和公共利益的不良信息内容的事件。
(四)网络故障事件:因电信、网络设备等原因造成大部分网络线路中断,用户无法登录信息系统的事件。
(五)服务器故障事件:因系统服务器故障而导致的信息系统无法运行的事件。
(六)软件故障事件:因系统软件或应用软件故障而导致的信息系统无法运行的事件。
(七)灾害性事件:因不可抗力对信息系统造成物理破坏而导致的事件。
(八)其他突发事件:不能归为以上七个基本分类,并可能造成信息系统异常或对信息系统当前运行造成潜在危害的事件。
第四条 按照造成信息系统的中断运行时间,将信息系统突发事件级别划分为一般(iv级)、较大(iii级)、重大(ii级)、特别重大(i级)。(一)一般(iv级):信息系统发生可能中断运行2小时以内的故障;
(二)较大(iii级):信息系统发生可能中断运行2小时以上、12小时以内的故障;
(三)重大(ii级):信息系统发生可能中断运行12小时以上、24小时以内的故障;
(四)特别重大(i级):信息系统发生可能中断运行24小时以上的故障。
第二章 组织机构和工作职责
第五条 预防和处理信息系统突发事件工作协调小组(以下简称“应急小组”)负责信息系统应急处理工作,决定信息系统应急处理工作的重大事项,组织实施、业务协调和发布信息系统应急指令,发布信息系统应急故障级别、决策处理方案。应急小组组长由分管信息技术工作的领导担任,成员为信息技术科全体人员。
第三章 预防与预警机制
第七条应急小组针对各种可能发生的信息系统突发事件,建立和完善预测预警机制。
第八条 预警信息分为外部预警信息和内部预警信息两类。外部预警信息指信息系统外突发的可能需要通信保障、安全防范,或可能对信息系统产生重大影响的事件警报。内部预警信息指信息系统网内的事故征兆或局部信息系统突发事故可能对其他或整个网络造成重大影响的事件警报。
第九条应急小组要加强对信息系统的日常监测工作。监测的内容主要包括:
(一)局域网通讯性能与流量;
(二)网络设备和安全设备的操作记录、网络访问记录;
(三)服务器性能、数据库性能、应用系统性能等运行状态,以及备份存贮系统状态等;
(四)服务器操作系统、数据库安全审计记录、业务系统安全审计记录;
(五)计算机漏洞公告、网络漏洞扫描报告;
(六)病毒公告、防病毒系统报告;
(七)其他可能影响信息系统的预警内容。
第十条 应急小组获得外部重大预警信息或通过监测获得内部预警信息后,应对预警信息加以分析,按照早发现、早报告、早处臵的原则,对可能演变为严重事件的情况,部署相应的应对措施,通知相关部门做好预防和保障应急工作的各项准备工作,并及时报告所领导。
第四章 应急响应程序
第十一条 信息系统使用单位或人员发现信息系统突发事件后,应及时报告应急小组。应急小组及时组织相关人员查找故障原因,在短时间内(一般要在半小时以内)依据故障情形和修复时间进行初步判别,确定故障分类级别,较大(iii级)及其以上的突发事件应报告所领导。
第十二条 信息系统突发事件发生后,根据突发事件严重程度,由所领导决定并指定特定小组或人员及时向新闻媒体发布相关信息,所指定的小组或人员应严格按照所领导规定及要求对外发布信息,其他部门或个人不得擅自接受新闻媒体采访或对外发布自己的看法和意见。
第十三条 发生较大(iii级)及其以上信息系统突发事件时,应急小组除向所领导报告外,应立即通知各业务部室。各业务部室应在各业务大厅张贴告示牌,同时做好服务对象的解释和疏导工作,并尽可能通过电话、网络、短信等方式通知参保单位经办人员。
第十四条 根据不同的事件以及事件的级别,采取相应措施进
行应急处理。突发事件处理过程中,可以根据需要调整故障级别。
(一)网络攻击事件应急预案:
1.当发现网络被非法入侵、网页内容被篡改,应用服务器的数据被非法拷贝、修改、删除,或有黑客正在进行攻击等现象时,使用者或管理者应断开网络,并立即报告应急小组。
2.应急小组立即关闭相关服务器,封锁或删除被攻破的登陆帐号,阻断可疑用户进入网络的通道,并及时清理系统、恢复数据和程序,尽快将系统和网络恢复正常。
(二)信息破坏事件应急预案:
1.当发现信息被篡改、假冒、泄漏等事件时,信息系统使用单位或个人应立即通知应急小组。
2.如被篡改或被假冒的数据正在征缴或发放过程中,应急小组应立即通知代收代发机构中止征缴或发放工作。
3.应急小组通过跟踪应用程序、查看数据库安全审计记录和业务系统安全审计记录查找信息被破坏的原因和相关责任人。
4.应急小组提出修正错误方案和措施,通知各业务部室进行处理。(三)信息内容安全事件应急预案:
1.当发现不良信息或网络病毒时,系统使用人员立即断开网线,终止不良信息或网络病毒传播,并报告应急小组。
2.应急小组根据情况通告局域网内所有计算机用户,隔离网络,指导各计算机操作人员进行杀毒处理、清除不良信息,直至网络处于安全状态。
【篇2:软件系统故障应急预案111】
服务器软件系统故障应急预案
发生紧急故障时的判断及处理:
发生服务器软件系统故障后,客户如果未签订服务器系统维护协议,在服务器重启未能解决的情况下,通知客户经理和客户自行处理。若已经签订服务器系统维护协议的客户,服务器管理员应立即对服务器进行查看,分析故障原因,采取相应措施;必要时,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据,进行快速恢复。如果没有恢复磁盘,应优先检查故障原因进行解决,如果无效,再客户同意的情况下以最新数据备份恢复的方式进行或采取其他措施。服务器软件故障范畴:
服务器软件故障包括:操作系统故障,应用软件故障,病毒黑客攻击等。
其他注意事项:
事态或后果严重的,及时上报公司领导。
处置结束后, 系统管理员应将事发经过、处置结果等结束后一日内备案存档。
采取的技术措施:
在故障发生后立即查看服务器系统状态,如果是系统软件出现故障,并且能进入系统,且可以清晰定位故障原因,并可以立即排除,那么立即进行排除。如果估计在1小时之内都不能定位故障原因,那么报告客户经理和客户,同时联系厂商及技术支持协助排除,或根据技术支持的建议进行重新安装操作系统和应用系统。排除操作系统故障的方法,检查操作系统进程是否都正常,有无非法进程,操作系统文件有无损坏丢失,是否受到病毒和木马程序侵害,黑客攻击。
如果不是操作系统故障,应该对应用系统进行仔细检查,检查方法,查看应用系统代码和数据是否被破坏,损坏,丢失,如果丢失,从正确的备份进行恢复。平时需做的准备工作:
a、操作系统和相关配置定期备份。b、相关应用系统及数据定期备份。c、必要的情况下准备备用域名。
d、确保备份数据做到三方备份(本地服务器,其他服务器,异地服务器)。
e、做好备用服务器的搭建及定期测试。
成立应急预案小组成员及分工:
杨胜灵 负责整体技术把控、技术支持及开发人员临时紧急调配。
孙道斌 负责网站、网站设计相关技术支持及设计人员临时紧急调配。
宫元 负责客户、域名及域名解析相关事宜。
李俊 负责机房及服务器相关技术整体把控,相关维护管理人员的临时紧急调配。
张尊园负责电信及电信危机公关的处理。
【篇3:信息系统故障应急预案】
嵊州市谷来镇卫生院信息管理系统
故障应急预案
为加强我院信息系统的管理,确保信息系统的安全运行,提高应对突发事件的能力,保证我院正常的医疗服务和就医秩序,促进信息系统在我院的应用和发展,特制定嵊州市谷来镇卫生院院信息系统故障应急预案如下:
一、应急预案责任制
(1)建立以院长为组长,副院长为副组长,信息系统管理员和各相关部门负责人参加的信息系统安全运行领导小组,信息系统管理员由赵洪海兼任;
(2)领导小组负责全院突发事件的“应急预案”制定、实施和全院信息系统日常安全运行管理的组织协调及决策工作;
(3)信息系统管理员负责应急恢复信息系统运行的技术保障及复杂故障联络软件维护商的工作;
(4)后勤部门负责应急恢复信息系统供电和网络布线的技术保障;(5)各行政和业务职能部门负责维持正常的医疗秩序,并根据“应急预案”实施相应的应急措施。
本应急预案适用于院办、财务科、门急诊、护理部、药剂科、检验科、放射科、防保科、妇产科、计算机中心、后勤、各分院等使用和维护医院信息系统的各业务职能部门、临床科室和医技科室;发生信息系统(大面积或者全部局域网计算机)故障,按不 同情况启动“应急预案”的实施。
二、应急预案通报制度
(1)信息系统应用部门发现信息系统或供电系统故障,应及时立即通知信息系统管理员或后勤部门;
(2)信息系统管理员或后勤部门应在15分钟之内初步查明故障原因、所需恢复时间,通知相关应用部门,必要时及时向领导小组报告。(3)信息系统管理员或后勤部门应在故障排除后,通知相关应用部门结束“应急预案”的实施。
三、信息系统故障一般应急措施
各业务应用部门一般应在获知信息系统故障不能排除,并获知故障初步原因和所需恢复间后,立即采取如下措施:
(1)启用应急预案时,在排除信息系统运行故障的同时,各业务应用部门相关人员及时到现场组织协调工作;做好对病人的疏导解释和应诊等工作。
(2)医保结算系统故障,医院信息系统正常时,为医保病人扣压其医保卡及相应现金后可先让其进行医疗过程,故障解除后再行结算;(3)医院信息系统故障时间超过30分钟,在财务门急诊收费窗口开启手工收费,开具手工收据。在其他业务部门均启动手工作业;财务结算部门对信息系统故障期间产生的手工数据,在故障排除后予以补录。
(4)各分院发现信息系统故障应首先检查,如不能启动,先检查电源是否插好,开关是否打开;系统故障可重新启动计算机或打印机试试;再看看网络是否通畅,如网络不通,需先重启路由器及调制解调器;全部完成后故障未解决,通知信息系统管理员。
四、信息系统管理员处理故障一般应急措施
(1)信息系统管理员接到总院内故障报告后,应立即到现场进行解决,如发现故障复杂不能自行解决,由信息系统管理员联系软件维护商解决。但如发现网络不通发生的故障,软件维护商无法通过远程解决的,信息系统管理员应判断网络不通的原因,如是院内路由器、网线等硬件故障,应自行解决或把硬件用备用件替换后送修;如为电信等网络提供商故障,应及时通知网络提供商进行解决;如为农保,医保等中心服务器故障也应及时通知相关人员解决。(2)信息系统管理员接到分院故障报告后,应先在电话中了解故障情况,初步判断故障原因,如能通过电话指导解决,就在电话指导下解决;网络通畅,也可通过远程控制系统进入分院计算机进行查看和处理,也可通知软件维护商远程解决;如分院信息系统故障是网络不通,分院工作人员又无法自行解决,信息系统管理员应尽快去现场查看并处理。
五、计算机的日常管理
(1)信息系统管理员负责计算机等软硬件的日常管理,对备
用计算机及零件要统一存放保管,故障修理要有记录,及时总结,普遍性问题要及时对相关人员进行培训指导。
(2)各业务应用部门相关人员不得随便使用使用优盘、移动硬盘、光盘在计算机上存储和复制文件,更不得私自将计算机接入互联网,防止病毒侵入系统;也不得私自进入服务器内修改数据,如违反上述规定导致系统故障,所造成的损失由个人承担,违反法律的追究法律责任。也不得在计算机上播放电影、歌曲,不得在计算机上玩游戏,如发现一次扣发奖金五十元。备注:
(1)医院管理系统——杭州达人软件有限公司联系方式廖春平 *** 83114015
张见松 ***
(2)电子健康档案系统维护——杭州万达联系方式
陆小平***
(3)嵊州市卫生信息化管理qq群:171436290
(4)网络及硬件维护:
源因信息技术有限公司 3128889
第2篇:变压器故障应急预案
变压器故障应急预案
1、表象 1.1 紧急停运
1.2 主变各连接部位严重发热 1.3 主变声音异常
2、应急处置 2.1 紧急停运
2.1.1 发生事故后,值班运行人员应立即向值班调度员及主管领导汇报已发生事故,明确报告事故发生的时间、基本情况。
2.1.2 当值调度员应迅速判断事故所引起后果,启动后备应急方案(改变运行方式),并根据情况及时上报上级调度部门,请求支援。2.2 主变及各连接部位严重发热
2.2.1 值班运行人员应立即向值班调度员报告设备异常情况,请求下一步工作指令。
2.2.2 当值调度员应迅速判断故障可能引起的后果,明确下达工作指令。2.2.3 启动后备应急方案(改变运行方式)或通知抢修部门(或相关单位)确定故障原因,恢复设备功能。2.3 主变声音异常
2.3.1 变压器运行正常时是发出连续匀称的嗡嗡声。2.3.2 除此之外的声音均为异常声响。
2.3.3 值班运行人员应立即向值班调度员报告设备异常情况,请求下一步工作指令。
2.3.4 当值调度员应迅速判断故障可能引起的后果,明确下达工作指令,启动后备应急方案。
3、故障判断 3.1 紧急停运
3.1.1 一般为变压器主体故障,主要有铁芯局部短路或熔毁,绝缘损坏;线圈间短路、断线,对地击穿;分接开关触头灼伤或有放电;套管对地击穿或放电;或继电保护动作等。严重时会起火。
3.1.2 变压器自动装置跳闸:此时应检查外部有无短路,过负荷和二次线路等故障,如故障原因不在外部,则需要检查绝缘电阻。3.2 主变及各连接部位严重发热
3.2.1 带荷后发热,可能是变压器功率不匹配;冷却系统散热不好;连接部位接触不良;
3.2.2 变压器主体本身质量存在问题。3.3 主变声音异常的判断
3.3.1 变压器发出“吱吱”声时,说明有闪络,这时必须检查变压器金属件的尖锐部分是否倒钝。
3.3.2 变压器有“哔剥”声时,表示有击穿现象,可能发生在线圈或铁芯与夹件间。
4、抢修恢复
4.1 变压器主体故障应及时通知厂家来人修理。
4.2 其他故障,应先隔离故障设备,确定故障点。通知抢修部门(或相关单位)检修设备,排除故障。
4.3 功率不匹配、冷却系统散热不好、连接部位接触不良等应通知抢修部门(或相关单位)检修设备,排除故障。
4.4 设备恢复正常后,重新投入运行时,运行人员应逐一恢复送电。
第3篇:网络故障应急预案
Fpg
網絡故障應急預案
為確保公司機房安全與穩定,以保證正常運行為宗旨,按照“預防為主,積極處置”の原則,本著建立一個有效處置突發事件,建立統一指揮、職責明確運轉有序、反應迅速處置有力の機房安全體系の目標,特制定本預案。
第一條 機房日常維護 1.建立健全機房管理制度
(1)在正常工作日內,網絡員負責對機房進行監控,主要職責是:巡視網絡設備及系統の運行情況,發生異常情況及時處理,消除網絡故障隱患。
(2)機房采取來人來訪登記制度,未經允許,無關人員不得進入公司機房區域。
2.機房內嚴格采取防雷、防火、防塵、防靜電等措施以及機房入口處24小時監控錄像等措施。
3.認真做好數據備份工作,定期做一次數據庫完全備份,每月檢查服務器運行和備份情況。
4.網絡員對機房の主要網絡設備(路由器、主幹交換機等)進行工作時間內全程監控,發現異常情況應及時進行處理,確保整個分公司網絡の正常運行。
第二條 機房突發事件應急處置方案 1.電源系統應急預案
Fpg
Fpg(1)定期檢查機房供電設備の運行狀況和電路線纜器材情況,當發生下列突發事件時,按照以下方案進行處置:
(2)當機房發生國電供電突然停電或是電源異常時。首先應和計量科聯系確認正常停電以及預計停電時間。檢查不間斷電源の電池可供電時間,確保設備正常運行,如遇到突然斷電,應及時將空調等不在UPS電源供電範圍內の設備及時斷電,預防突然來電時瞬間電流過大導致設備損壞等現象。
(3)當確定停電時間超出機房UPS承載範圍後,首先確定停電の範圍以及受影響の設備範圍。並及時通知各部門做好停電應急准備。然後到達現場,做好各設備の電源停電准備。在UPS供電電量僅剩10%之後,嚴格按操作手冊停掉各服務器の電源,最後停核心交換機和路由器,等待電力恢複。
(4)當確定停電原因是在本身供電系統範圍內,立即匯報給負責領導,並及時聯系相關維護人員達到現場檢修。對於恢複時間無法預計の,要通知各單位做好停電准備。
(5)恢複供電後,嚴格按照操作程序逐步恢複機房設備和UPSの供電,以防瞬間電流過大造成設備損壞。
2.網絡和服務器絡系統應急預案
(1)發生網絡故障時,首先檢查機房設備情況,確定網絡故障の原因。
Fpg
Fpg(2)確認原因後,通知急需用網部門做好應急准備,具體開始及停止指令由企業管理科負責人在公司微信管理群通知。秤房車輛過秤機打票據臨時改成手簽票,但須當班司稱員、生產調度、計量科科長、企業管理科科長、共同簽字確認。
(3)當確認原因為短時間無法恢複,應該及時向負責領導匯報,並向相關部門匯報。然後通知各部門,做好應急准備。然後及時處理故障。處理完畢後通知各部門回複正常網絡使用。
(4)出現斷網情況時實時監控會出現無視頻信號提示,出現此情況時網絡維護員應及時通知領導並做好記錄。網絡修複後應第一時間查看回放。
(5)當人為或病毒破壞の故障發生時,具體按以下順序進行:判斷破壞の來源及性質,斷開影響安全與穩定の信息網絡設備,斷開與破壞來源の物理網絡連接,跟蹤並鎖定破壞の來源和其他網絡用戶信息,修複被破壞の信息,恢複系統。
(6)發生服務器系統故障後,應立即電話向相關領導匯報情況,及時聯系集團技術人員,在確認安全の情況下,重新啟動故障服務系統:若重啟系統成功,則檢查數據丟失情況,利用備份數據恢複;若重啟失敗,立即聯系集團相關部門,請求技術支持,做好技術處理。處置結束後,網絡維Fpg
Fpg 護員應將處理過程記錄下來,以方便日後對此問題の關聯查詢。
3.消防和防雷應急預案
(1)上班工作時間發生火警,組織人員及時緊急撤離,並立刻撥打119報警。在確保自身安全の情況下,應盡量使用滅火器進行滅火,減少電子設備の損壞。同時采取關閉電源總閘等措施,盡量減少可能造成の損失和破壞。
(2)非工作時間或節假日休息時間值班人員發現火情後,要立刻撥打119報警,並立刻通知相關部門和領導,做好火災の處置工作。
(3)火情結束之後,網絡維護員應趕赴現場,並向公司相關部門匯報。同時立即聯系聯通、移動等相關網絡公司和設備相關廠家、保險公司,及時評估事故損失情況,研討恢複網絡系統正常運行の最佳解決方案。
(4)遇雷暴天氣或接上級部門雷暴氣象預警,應關閉所有服務器,切斷電源,暫停內部計算機網絡工作。雷暴天氣結束後,及時開通服務器,恢複內部計算機網絡工作。因雷擊造成の損失,應及時進行核實、報損,並將詳細情況向部門領導匯報。
4.自然災害和盜搶應急預案
(1)發生自然災害後,首先應該組織人員撤離現場。當確認災害不會造成人生傷害後,在回到機房檢查設備,立刻Fpg
Fpg 向上級領導和集團匯報,並聯系相關網絡和設備廠家,積極做好災後恢複工作,確保在最短時間內恢複機房正常運行。
(2)發生盜搶事件後,要保護好現場然後報警,並向領導匯報情況。待現場處理完畢後,要組織相關人員估計損毀情況,並聯系相關網絡和設備廠家,積極做好恢複工作。
Fpg
服务器故障应急预案一. 服务器软件系统故障应急预案1.发生服务器软件系统故障后,立即启动备份服务器系统,由备份服务器接管业务应用。2.相关责任人将故障服务器脱离网络,保存系......
消防设施故障应急预案应急预案指面对突发事件如自然灾害、重特大事故、环境公害及人为破坏的应急管理、指挥、救援计划等。它一般应建立在综合防灾规划上。以下是小编整理的......
刀豆文库小编为你整合推荐5篇消防设施故障应急预案,也许这些就是您需要的文章,但愿刀豆文库能带给您一些学习、工作上的帮助。......
刀豆文库小编为你整合推荐8篇服务器故障应急预案,也许这些就是您需要的文章,但愿刀豆文库能带给您一些学习、工作上的帮助。......
刀豆文库小编为你整合推荐7篇设备故障应急预案,也许这些就是您需要的文章,但愿刀豆文库能带给您一些学习、工作上的帮助。......