当前位置:文档之家› AFC系统故障应急处理办法

AFC系统故障应急处理办法

AFC系统故障应急处理办法
AFC系统故障应急处理办法

维修部AFC系统故障应急

处理办法

文件编号:WX/AFC

版本号: 1.0

受控号:

编制:

文件负责人:

审核:

批准:

2011--发布2012--实施

天津滨海快速交通发展有限公司

Tianjin Binhai Mass Transit Development Co.,Ltd.

2012年 1 月 维修部信号系统故障应急理办法

1 AFC 系统故障应急处理的总原则1.1当轻轨运营时间遇到紧急故障必须进行处理时,要遵循“确保安全” “部分设备停用或暂时退出”、“确保维持运营即可”的基本原则; 1.2如有备用设备,首先考虑投入备用;

1.3采用正确、果断、迅速、可行的应急办法进行快速处理,设法先行恢复设备运行;

1.4及时通知相关人员修复或更换故障设备,恢复正常运行状态; 1.5控制故障范围,防止事态进一步扩大对人身设备的威胁。 2 AFC 系统应急救援队组织机构和职责

2.1 AFC 系统应急救援队组织机构及联系方式

AFC 系统救援组织机构由救援队长、副队长、救援队员(含现场安全员)、应急物资管理员组成。

队长:AFC 室主任 联系电话:65702693 副队长:AFC 室维修主管 联系电话:65702728 现场安全员:由救援队长委派工区维修人员担任。

应急物资管理员:室级救援物资管理由AFC 室综合事务管理员担任,负责日常管理、与专业人员共同负责状态保障。工区救援物资由AFC 室工区工长负责日常管理检查及状态保障。

救援队员:安技主管、AFC 工程师、工区工长、AFC 工区人员等。 AFC 一工区 ——塘沽站:

AFC 二工区 ——一号桥站:AFC 三工区 ——十一经路站:组手持台

2.2 救援队各岗位职责

2.2.1 救援队长应急职责

●负责AFC事件救援指挥工作;

●负责与维修部值班工程师的沟通协调工作;

●负责专业外部资源的协调。

2.2.2 救援队副队长应急职责

●协助救援队长完成事故救援方案确定;

●负责专业救援物资的准备和协调;

●负责现场救援工作的组织实施。

2.2.3 AFC工程师应急职责

●负责故障信息的传达与沟通;

●负责组织并建立AFC救援队;

●负责抢修过程中关键节点的记录。

2.2.4安技主管、技术工程师应急职责

●当接到故障通知后,首先判断故障的性质、影响范围,是否涉及相关部

门;

●一般故障如果不能到达现场,应进行电话指导;

●凡影响三级及三级以上故障应立即前往现场组织处理;

●负责救援过程中关键节点事件和时间的记录;

●重大故障需要动用抢修物资时,组织人员领取抢修所用物资。

2.2.4工长应急职责:

●当接到通知后立即赶赴现场;

●负责故障恢复、复查和故障原因调查工作;

●负责故障记录的填写。

2.2.5 AFC工区人员应急职责:

●AFC设备发生故障时,向使用部门了解情况,再依次地向AFC工程师汇

报故障发生的时间、地点、现象和影响范围;

●准备防护用品、工具、仪表、备品备件,同时向使用部门登记要点。使

2012年1 月维修部信号系统故障应急理办法

2012年 1 月 维修部信号系统故障应急理办法

用部门给点后,再前往故障现场进行观察处理;

● AFC 设备一般故障由工区值班人员进行处理;故障处理不了时,及时向

技术工程师请求支援;

● 服从现场救援负责人的指挥,对设备故障进行恢复; ● 根据救援负责人的安排,由一名人员担当现场安全防护员; ● 故障恢复后,负责监督设备运行。 3、应急救援行动 3.1 接警与通知 3.1.1 信息传递与组织

维修调度接到AFC 设备发生故障时,立即通知AFC 室维修人员。AFC 维修人员应立即与现场人员联系,了解现场的情况并指导解决。根据故障信息和性质,AFC 维修人员要及时上报工长和相关系统工程师。AFC 工程师立即组织建立抢修救援队。

1)AFC 工程师接到三级故障或者较难以解决的重大故障后,立即组织当班维修员工组成临时救援队,同时确定救援负责人,当工程师及以上人员达到后,接替临时负责人的工作。

2)非工作时间信号设备出现故障时,AFC 工程师可调集就近工区的值班人员,人员不够时,可通知家庭居住地离事件发生地点就近的AFC 室员工。

3)驻站值班人员向使用人员了解设备故障现象,同时将信息反馈给维修调度和AFC 工程师。

4)救援队长一般由AFC 室主任担任,在其未到达事件现场之前,可依次序委派维修主管、安全技术主管、技术工程师担任。

5)在非工作时间第三负责人及以上不能在规定抢修的时间内赶到现场时,指定当值的工区工长担当抢修救援临时队长。具体安排如下:

● AFC 一工区工长负责胡家园站(含胡家园站)以东的设备故障抢修工

作;

● AFC 二工区工长负责钢管公司站(含钢管公司站)以西至一号桥(含

一号桥站)以东的设备故障抢修工作;

● AFC 三工区工长负责中山门站(含中山门站)以西的设备故障抢修工

2012年 1 月 维修部信号系统故障应急理办法

作; 3.1.2 通信工具

1)AFC 当值维修人员备有无线对讲手持台,日常置于AFC 组状态,便于与维修调度及工区联系。

2) AFC 室各工区及车站机房备有固定电话,便于与维修调度及工程师通话。AFC 室主任、维修主管、安技主管、技术工程师及工长保证手机全天候24小时开机,当值维修工值班期间手机处于开机状态。维修调度持有AFC 各工区公务固定电话号码及工区值班人员的私人手机号码。 3.2 指挥与协调 3.2.1 工区

AFC 一工区、AFC 二工区、AFC 三工区、检修工区所在地及值班点存放必备的物资、工具及仪器仪表,人员具备应急状态,人员应急心理素质良好,设备故障时应做到紧张有序,在接到通知后第一时间赶往事件现场。 3.2.2 抢修车辆

事件发生后,由AFC 工程师向维修调度申请抢修汽车,并通知救援队人员登乘汽车的时间和地点。 3.2.3 救援行动

3.2.3.1当有关人员接到事件紧急救援通知时,应尽最大努力第一时间赶赴事件现场。

3.2.3.2先期抵达事件现场的人员,与车站的相关人员进行联络,进行登记要点后,对现场进行初步勘察和评估,应及时向救援队报告,说明所需技术支援、备件、工器具等要求。

3.2.3.3首名抵达现场的AFC 工程师担当信号专业事件救援技术支持工程师。

3.2.3.4 AFC 专业事件救援工程师负责指挥AFC 事件现场抢险恢复工作及事故现场的安全防护工作:

● 在事现场,确认故障影响范围和救援工程区域,确定抢修方案; ● 有需求时,联系维修部值班工程师要求事件抢修现场接触网断电并封

挂地线;

2012年 1 月 维修部信号系统故障应急理办法

● 负责安排抢修过程中的安全防护工作; ● 对抢修过程中遇到的问题提供技术指导;

● 故障抢修完成后,事件救援技术支持工程师下令撤出事故现场,并巡

视现场情况,确认人员、设备等全部出清; 3.3 现场恢复程序

现场救援抢修应严格执行AFC 室的相关工作指引和设备故障处理流程。 4、应急物资管理

4.1 AFC 室级应急救援物资设置在工区值班室,遇有突发故障时,可及时使用到事发地点;AFC 室应急物资台帐存放在档案文件夹中,AFC 室应急救援物资由工长每月进行一次整备。

4.3各工区值班室存放日常必需的备品备件、材料、抢修用工器具及仪器仪表。

每一种故障分五小项进行编写 1故障现象: 2原因分析: 3应急处理方法:

4故障处理标准时间及应急操作人员数量: 5经验总结:

以下为信号系统编写参考实例:

5、AFC 系统故障应急处理办法 5.1AFC 车站计算机通讯故障

5.1.1故障现象:车站计算机与终端设备失去通讯。

2012年 1 月 维修部信号系统故障应急理办法

5.1.2原因分析: ① 线缆通路断线或虚接; ② 车站计算机软件故障; ③ 车站计算机主机故障; ④ 网络交换机故障; 5.1.3应急处理方法:

5.1.4故障处理标准时间及应急操作人员数量: 5.1.4.1故障处理标准时间

① 线缆通路断线或虚接:1-5分钟; ② 车站计算机软件故障:10-30分钟; ③ 车站计算机硬件故障:25-45分钟; ④ 网络交换机故障:30-45分钟;。 5.1.4.2应急操作人员数量:3人

5.1.5经验总结:维修时会缺失该站的设备软件数据,要及时与清分室进行沟通。 5.2售票设备故障

5.2.1故障现象:车站所有售票设备无法发售车票。 5.2.2原因分析:

2012年 1 月 维修部信号系统故障应急理办法

① 自动售票机硬件损坏; ② 自动售票机软件损坏; ③ 半自动售票机硬件损坏; ④ 半自动售票机软件损坏; 5.2.3处理方法:

5.2.4故障处理标准时间及应急操作人员数量: 5.2.4.1 故障处理标准时间:20分钟~2小时 5.2.4.2 应急操作人员数量:

5.2.5经验总结:要保证设备在故障后,乘客无滞留。在维修过程中,要与车务部、清分室进行协同工作处理故障。

2012年1 月维修部信号系统故障应急理办法

运维制度及流程

运行维护管理制度 2017年8月

目录3 3 3 5 6 6 7 8 8 9 9

1、总则 第一条为保障公司信息系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。 第二条运维工作总体目标:立足根本促发展,开拓运维新局面。在企业发展壮大时期,通过网络、桌面、系统等的运维,促进企业稳定可持续性发展。 第三条运维管理制度的适用范围:运维部全体人员。 2、编制方法 本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 3、运维部工作职责 一、负责网站运维和技术支持 (一)根据网站运营战略和目标,负责网站整体架构、栏目、应用系统等技术开发方案制定和组织开发,保障网站技术的稳定性和先进性。 (二)负责网站栏目和应用系统的使用培训和操作使用指南编

写,对用户使用过程中出现问题的沟通和解决; (三)网站设备和软件购买计划书的拟定,包括采购数量、品牌规格、技术参数。会同行政部进行采购。 (四)网站设备和软件操作规程和应用管理制度的制定,并负责监督执行。 (五)网站设备和软件安装、调试和验收,使用培训和维修保养。 (六)网站日常运行过程中信息安全和技术问题的协调解决,保障网站24小时安全稳定运行。 (七)网站技术服务外包管理,主要包括技术外包开发、运行服务托管和空间域名管理。 (八)负责网站管理系统及设备保密口令的设置和保存,保密口令设置后报中心主任备案,保密口令设定后任何人不得随意更改,保密口令每季度更新一次。 (九)负责网站新程序、新系统和网站改版升级方案技术的设计开发。 二、负责网站信息和技术安全 (一)执行国家和省上有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络,及时处理网站信息技术安全方面存在的问题,确保网站安全、稳定、可靠运行。 (二)网站信息技术安全保密制度和工作流程的制定,落实信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。

软件系统故障应急预案

服务器软件系统故障应急预案 发生紧急故障时的判断及处理: 发生服务器软件系统故障后,客户如果未签订服务器系统维护协议,在服务器重启未能解决的情况下,通知客户经理和客户自行处理。若已经签订服务器系统维护协议的客户,服务器管理员应立即对服务器进行查看,分析故障原因,采取相应措施;必要时,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据,进行快速恢复。如果没有恢复磁盘,应优先检查故障原因进行解决,如果无效,再客户同意的情况下以最新数据备份恢复的方式进行或采取其他措施。 服务器软件故障范畴: 服务器软件故障包括:操作系统故障,应用软件故障,病毒黑客攻击等。 其他注意事项: 事态或后果严重的,及时上报公司领导。 处置结束后, 系统管理员应将事发经过、处置结果等结束后一日内备案存档。 采取的技术措施: 在故障发生后立即查看服务器系统状态,如果是系统软件出现故障,并且能进入系统,且可以清晰定位故障原因,并可以立即排除,那么立即进行排除。如果估计在1小时之内都不能定位故障原因,那么报告客户经理和客户,同时联系厂商及技术支持协助排除,或根据技术支持的建议进行重新安装操作系统和应用系统。排除操作系统故障的方法,检查操作系统进程是否都正常,有无非法进程,操作系统文件有无损坏丢失,是否受到病毒和木马程序侵害,黑客攻击。

如果不是操作系统故障,应该对应用系统进行仔细检查,检查方法,查看应用系统代码和数据是否被破坏,损坏,丢失,如果丢失,从正确的备份进行恢复。 平时需做的准备工作: A、操作系统和相关配置定期备份。 B、相关应用系统及数据定期备份。 C、必要的情况下准备备用域名。 D、确保备份数据做到三方备份(本地服务器,其他服务器, 异地服务器)。 E、做好备用服务器的搭建及定期测试。 成立应急预案小组成员及分工: 杨胜灵负责整体技术把控、技术支持及开发人员临时紧急调配。 孙道斌负责网站、网站设计相关技术支持及设计人员临时紧急调配。 宫元负责客户、域名及域名解析相关事宜。 李俊负责机房及服务器相关技术整体把控,相关维护管理人员的临时紧急调配。 张尊园负责电信及电信危机公关的处理。

设备故障应急响应现状及改进措施管理方案(正式)

编订:__________________ 单位:__________________ 时间:__________________ 设备故障应急响应现状及改进措施管理方案(正式) Deploy The Objectives, Requirements And Methods To Make The Personnel In The Organization Operate According To The Established Standards And Reach The Expected Level. Word格式 / 完整 / 可编辑

文件编号:KG-AO-4272-45 设备故障应急响应现状及改进措施 管理方案(正式) 使用备注:本文档可用在日常工作场景,通过对目的、要求、方式、方法、进度等进行具体、周密的部署,从而使得组织内人员按照既定标准、规范的要求进行操作,使日常工作或活动达到预期的水平。下载后就可自由编辑。 1.编制目的 为了建立设备故障应急响应机制,充分发挥设备故障应急抢修的积极作用,确保设备发生故障时能够迅速、准确、有效的组织抢修处理,防止故障进一步扩大,最大限度的减少降产或停机损失,降低维修成本,依据公司20xx年11月1日颁发的《安全生产管理制度》(试行版),结合公司生产设备实际状况,特编制本预案。 2.适用范围 本预案适用于突发性的直接导致降产或停产的所有设备故障,用于指导设备故障的报警、处理、抢修、恢复等全过程。 3.各部门应急职责

3.1 生产部应急职责 3.1.1 生产部副经理担任现场应急抢修小组组长,负责设备故障的现场应急指挥; 3.1.2 负责向工厂总经理汇报故障状况及抢修进展情况; 3.1.3 负责组织抢修人员就位; 3.1.4 负责对备品备件的数量、型号、规格进行确认及抢修物质材料的准备; 3.1.5 负责加工件外协和委外维修的申请; 3.1.6 负责实施抢修作业,以及修后设备的检查、试运行; 3.1.7 加强抢修培训,开展故障预想,掌握故障发生的征兆、原因、后果和应急处理方法、步骤,以及在抢修过程中应采取的防护措施、安全措施、技术措施,确保抢修工作的安全顺利进行。 3.2 储运部应急职责 3.2.1 加强车辆维护和保养,及时提供可用的起重设备和运输设备;

运维部服务规范手册V2.1

上海伯乔信息科技有限公司 运维部服务规范手册 @ ~

版本历史 备注 版本/状态作者参与者、 起止日期 2011-8-29创建 、 增加运维流程、去掉部分 2011-9-16 表单 2011-10-12优化板块和界面 文档中特殊符号注解: 表示注解。 表示同个标题下不同项目或步骤 : 目录 目录 1服务文化 (3) 服务宗旨: (3) 服务理念: (3) 2服务总则 (4) 两个愿景: (4) 四项要求: (4) 七大不准 (4) 3运维规范 (5) , 24小时响应机制 (5) 远程排障规范 (5)

服务电话接听流程规范 (6) 接听电话 (6) 上门服务流程规范 (7) 生成上门服务单(见附表1) (7) 上门服务流程规范 (8) 交单归档 (17) 售前技术支持规范 (17) 售前技术支持的准备工作 (18) < 售前工作注意事项 (18) 拜访结束,填写表单 (19) 售前后续工作 (19) 售后培训服务规范 (20) 售后培训环境部署 (20) 售后讲师培训工作规划 (20) 培训体系优化 (21) 运维流程 (21) 4附表 (22) " 1服务文化 1.1服务宗旨: 愈精致、愈宽容、愈贴心

1.2服务理念: 激情、创造、分享、奉献 2服务总则 2.1两个愿景: 用我们的诚心满足客户服务需求,让伯乔客户感动用我们的专业提升客户使用价值,让伯乔品牌增值2.2— 2.3四项要求: 服装整洁,注重仪表 关注客户,真诚服务 操作规范,行为专业 乐于沟通,耐心指导 2.4七大不准 不准对客户的需求置之不理 不准代替客户在服务单据上签名 不准接受客户任何形式的馈赠 不准无故失约 :

故障应急处理方案

故障应急处理方案 1.电源不正确引发的设备故障。电源不正确大致有如下几种可能:供电线路或供电电压不正确、功率不够(或某一路供电线路的线径不够,降压过大等)、供电系统的传输线路出现短路、断路、瞬间过压等。特别是因供电错误或瞬间过压导致设备损坏的情况时有发生。因此,在系统调试中,供电之前,一定要认真严格地进行核对与检查,绝不应掉以轻心。 2.由于某些设备的连结有很多条,若处理不好,特别是与设备相接的线路处理不好,就会出现断路、短路、线间绝缘不良、误接线等导致设备的损坏、性能下降的问题。在这种情况下,应根据故障现象冷静地进行分析,判断在若干条线路上是由于哪些线路的连接有问题才产生那种故障现象。因此,要特别注意这种情况的设备与各种线路的连接应符合长时间运转的要求。 3.设备或部件本身的质量问题。各种设备和部件都有可能发生质量问题,纯属产品本身的质量问题,多发生在解码器、电动云台、传输部件等设备上。值得指出的是,某些设备从整体上讲质量上可能没有出现不能使用的问题,但从某些技术指标上却达不到产品说明书上给出的指标。因此必须对所选的产品进行必要的抽样检测。如确属产品质量问题,最好的办法是更换该产品,而不应自行拆卸修理。 4.设备(或部件)与设备(或部件)之间的连接不正确产生的问题大致会发生在以下几 个方面: ⑴阻抗不匹配。 ⑵通信接口或通信方式不对应。这种情况多半发生在控制主机与解码器或控制键盘等有通信控制关系的设备之间,也就是说,选用的控制主机与解码器或控制键盘等不是一个厂家的产品所造成的。所以,对于主机、解码器、控制键盘等应选用同一厂家的产品。 ⑶驱动能力不够或超出规定的设备连接数量。比如,某些画面分割器带有报警输入接口在其产品说明书上给出了与报警探头、长延时录像机等连接的系统主机连成系统,如果再将报警探头并联接至画面分割器的报警输入端,就会出现探头的报警信号既要驱动报警主机,又要驱动画面分割器的情况。 解决类似上述问题的方法之一是通过专用的报警接口箱将报警探头的信号与画面分 割器或视频切换主机相对应连接,二是在没有报警接口箱的情况时,可自行设计加工信号扩展设备或驱动设备。 5.视频传输中,最常见的故障现象表现在监视器的画面上出现一条黑杠或白杠,并且或向上或向下慢慢 滚动。因此,在分析这类故障现象时,要分清产生故障的两种不同原因。 要分清是电源的问题还是地环路的问题,一种简易的方法是,在控制主机上,就近只接入一台电源没有问题的摄像机输出信号,如果在监视器上没有出现上述的干扰现象,则说明控制主机无问题。接下来可用一台便携式监视器就近接在前端摄像机的视频输出端,并逐个检查每台摄像机。如有,则进行处理。如无,则干扰是由地环路等其它原因造成的。 6.监视器上出现木纹状的干扰。这种干扰的出现,轻微时不会淹没正常图像,而严重时图像就无法观看了(甚至破坏同步)。这种故障现象产生的原因较多也较复杂。大致有如下几种原因: ⑴视频传输线的质量不好,特别是屏蔽性能差(屏蔽网不是质量很好的铜线网,或屏蔽网过稀而起不到屏蔽作用)。与此同时,这类视频线的线电阻过大,因而造成信号产生较大衰减也是加重故障的原因。此外,这类视频线的特性阻抗不是75Ω以及参数超出规定也是产生故障的原因之一。由于产生上述的干扰现象不一定就是视频线不良而产生的故障,因此这种故障原因在判断时要准确和慎重。只有当排除了其它可能后,才能从视频线不良的角度去考虑。若真是电缆质量问题,最好的办法当然是把所有的这种电缆全部换掉,换成符合要求的电缆,这是彻底解决问题的最好办法。

AN5006-04设备常见故障处理手册

An5006-04常见故障处理手册 烽火通信科技股份有限公司宽带产品部 Fiberhome Telecommunication Technologies Co. Ltd. Broadband Product Division 网址:https://www.doczj.com/doc/689411567.html,

前言 本手册针对烽火通信科技股份有限公司AN5006-04设备语音模块在外工程使用过程中较为常见的一些故障给出常用的解决办法,目的在于帮助工程人员迅速、准确定位和解决问题。 本手册首先介绍定位AN5006-04设备语音模块常见故障定位手段,然后列举一些AN5006-04设备的故障案例,以供进行故障处理时参考。 AN5006-04设备语音模块在本手册中简称为IAD。 本书适合以下人员阅读: 网络管理员 网络工程师 技术推广人员

目录 1常用定位问题手段 (1) 1.1版本查询 (1) 1.2H248协议相关参数查询 (1) 1.3网关注册状态和端口状态查询 (2) 1.4IP地址查询 (2) 1.5语音算法查询 (2) 1.6抓包分析 (3) 2摘机没有拨号音 (4) 2.1故障现象 (4) 2.2原因分析 (4) 2.3解决办法 (4) 3IAD作为被叫振铃一声后便不再振铃 (6) 3.1故障现象 (6) 3.2原因分析 (6) 3.3解决办法 (6) 4通话时有回音 (8) 4.1故障现象 (8) 4.2原因分析 (8) 4.3解决办法 (8) 5通话时音量过大或者过小 (10) 5.1故障现象 (10) 5.2原因分析 (10) 5.3解决办法 (10)

1常用定位问题手段 1.1版本查询 出现问题后一般建议先查看设备的版本号,看设备目前的版本是否为最新的版本,通过升级到最新版本后直接解决。可通过网管或者在串口/TELNET界面使用命令“show version”命令查看版本号。 串口/TELNET界面命令如下: MG6002(F2)#show version 协议类型: Megaco V1.1.0.4 & V5.2 软件版本: R4.05.02.12 软件版本日期: Jun 25 2008 22:42:08 Linux内核版本: 2.37 1.2H248协议相关参数查询 如果端口采用H248协议,协议相关参数一定要配置正确,否则IAD将无法成功注册到MGC,进而无法进行通话。 查询协议相关参数可通过网管或者在串口/TELNET界面使用命令“show megaco”和“show endpoint”,分别检查网关参数和端点相关参数。 串口/TELNET界面命令如下: MG6002(F2)#show megaco 当前H.248协议配置 ============================== 网关名称: 138.1.123.22 网关IP地址: 138.1.123.22 网关端口: 2944 RTP端口范围: 4000~10000 MGC地址: 138.1.1.123 MGC端口: 2944 是否使用备份MGC: 否 网关注册状态: REGISTERED 是否使用设备MAC作为网关名称: 否 是否启用心跳机制: 否 MG6002(F2)#show endpoint 端口是否注册端口名称连接状态协议类型

(完整版)中国铁塔动环常见告警处理指导手册

中国铁塔动环常见告警处理指导手册一、FSU离线告警 告警名称:FSU离线; 告警解释:FSU和铁塔集团平台连接通讯中断; 原因分析:1)信号差或不稳定;2)FSU设备掉电;3)无线模块硬件故障;4)FSU设备硬件故障;5)天线和无线模块连接中断,或天线丢失;6)VPN服务器连接不上;7)SIM卡被盗、欠费或故障。平台处理方法:查询历史告警记录,如频繁离线或长时间离线,需现场检查。 现场处理方法: 第一步检查供电: 1)在运维监控系统检查离线站点是否有停电告警,判断是否现场停电; 2)现场检查FSU指示灯不亮设备没有供电。 原因分析:FSU供电异常。 解决方案: 1)检查整个基站是否停电,如停电则通知相关人员取电; 2)检查FSU供电空开是否跳闸及通电线路是否正常。 第二步检查无线模块: 检查无线模块指示灯都不亮或都常亮。

原因分析:无线模块供电异常或无线模块故障。 解决方案: 1)无线模块供电故障,则检查给无线模块供电接线是否正常如正常,则用万用表测量给无线模块供电FSU输出端是否有12V,如没有则为FSU供电板问题,更换FSU供电板。 2)确认供电正常,则更换无线模块进行测试。 下站建议:下站时建议随身带上一套可以成功拨号的无线网卡和SIM 卡,下站的时候作对比验证,快速确认是SIM卡问题,还是无线模块问题。 第三步FSU检查 通过EISUConfig软件登陆FSU设备,点击设备诊断管理。 1)信号强度弱:通过设备软件登录设备,如信号强度小于15。

解决方案:更换运营商无线模块或将天线外延(室内站放到室外,室外柜放到底部隐蔽区域或有外层保护情况下放到机柜顶部) 2)铁塔VPN网络连接异常:铁塔VPN网络提示连接异常 3)铁塔网管未注册:铁塔网管提示连接异常(正常显示连接正常)解决方案: 确认总部平台正常,重启FSU(等待程序连接)。如重启后未恢复,联系厂家专业人员。 平台恢复确认:告警管理-活动告警监控-当前告警查询该站点,确认告警是否消除。 二、电源配套告警 2.1开关电源类告警: 2.1.1开关电源通信状态告警 告警名称:开关电源通信状态告警; 告警解释:开关电源和FSU之间的通讯中断; 原因分析:开关电源和FSU之间的通讯中断 平台处理方法:无 现场处理方法:检查开关电源屏幕是否显示正常,和FSU的监控线连接是否正常。

信息系统故障处理应急预案

信息系统故障处理应急预 案 The final edition was revised on December 14th, 2020.

上饶县交通警察大队 信息系统故障处理应急预案 一、信息系统应急预案组织机构 为了保证公安交警网络和信息系统的安全,防止因电脑硬件、软件、网络故障而产生的大队业务、网络使用的瘫痪,特制订上饶县交警大队信息系统安全应急方案。 二、信息系统故障等级划分 1、一级故障 信息系统发生故障,预计将或已经严重影响大队各窗口单位、业务单位相关业务中断1小时以上,并预计4小时以内无法恢复的,具备以下一个或几个特征,即定义为一级故障。 1.交警指挥大楼至支队公安网出现线路和设备故障; 2. 交警指挥大队内部网络出现故障; 3.大队计算机房供电系统、空调系统等外围保障设施出现严重故障; 6.病毒攻击造成大队网络专网中断或传输效率明显下降,关键业务系统不能正常提供服务; 7.病毒攻击造成大楼各网络感染客户端设备10台以上,导致关键业务系统和办公系统不能正常提供服务; 8.利用技术手段,造成业务数据被修改、假冒、泄漏、窃取的信息系统安全事件。 2、二级故障

满足以下条件之一,即定义为二级故障。 1.故障发生后,影响到信息系统的运行效率,速度变慢,但未影响车管等主要业务现场。 2.故障发生后预计在2小时以内恢复。 3、三级故障 满足以下条件之一,即定义为三级故障。 1.故障发生后,可随时应急处理,不会影响的系统全面运行,但是一种隐患。 一级和二级故障为重大故障;三级故障为一般性故障。 二信息系统故障处理程序 1、故障的发现 信息中心人员在发现故障或接到故障报告后,首先要记录故障发生时间和发现时间,以及发现部门、发现人,对故障的等级进行初步判定,并报告相关人员进行处理。 2、故障的处理 1.信息中心科室为故障处理部门,故障处理部门领导负责通知和落实相应岗位人员到出现故障科室部门,应先询问了解设备和配置近期的变更情况,查清故障的影响范围,从而确定故障的等级和发生故障的可能位置。 2. 对于重大故障按照的故障升级上报要求进行上报,并在处理过程中及时向主管关领导通报故障处理情况。 3. 对于一般性故障按照的故障升级上报要求进行上报,并在处理过程中及时通报故障处理情况。

设备故障应急处理预案

设备故障应急处理预案一、 二、突发事件处理流程:

设备故障应急处理预案

一、供电突发性事故的应急措施 (一)外线故障 1、根据小区设计要求:主供停电、备供自动投入。当外线故障导致小区主供电源停电时,值班人员要检查真空开关的指示牌是否分闸,再检查电压和指示灯,当明确失压断电后,将主供电源进线柜真空开关退出,挂“有人工作,禁止合闸”指示牌。 2、备用电源处于非自动位置,故主供电源断电时不能自动合闸, 检查备供电源进线柜之电表和指示灯、真空开关应处准备合闸位置, 合上备供电源进线柜开关。 3、检查变压器出线柜,是否正常。 4、检查低压受电柜,并合上低压总开关。 5、向供电局调度室报告并了解外线故障情况。 (二)内部故障 当高压柜真空开关、高压电缆或变压器出现故障时(短路或接地),非误操作引起,除该高压柜停电,甚至会引起主供电或备用电源的受电柜停电,此时值班人员应遵守下列程序: 1、将故障柜的真空开关退出(若引起火警,一人用手提式1211灭火器灭火,一人向消防中心报告)。 2、将故障柜的低压总开关退出,挂“有人工作,禁止合闸”指示牌。 3、将低压母联合闸,保证小区设施用电。 4、向工程部主管报告故障经过和处理情况。 5、召开事故分析会,邀请供电局、厂商及有关方面参加,分析事故发生原因和处理措施,并书面总结报告有关部门。 (三)市电全停 1、当主供、备用两路市电全停,启动发电机。

2、退出市电联系开关,合上发电机联系开关,向应急负荷供电,并每隔15分钟检查一次发电机运行状况,如燃油量、水温等。 3、监视市电进线电压,尽快与供电局联系,一旦市电恢复正常,立即退出发电机电源,恢复市电供电。 4、作好记录,及时向上级领导报告。 5、市电失压,发电机正常情况下将在15秒钟自动启动。若有异 常改用手动启动。 (四)通知用户 1、供电系统紧急故障发生后应马上由工程主管预计修复时间。 2、4小时内可修复的故障,应由物业办指挥中心通知受影响业主、物业使用人。 3、4小时以上才可修复的故障应由管理处或供电单位通知受影响业主、物业使用人。 (五)自备发电机发电措施 1. 将发电机打在“手动”档上; 2. 在有“市电供电”和“发电供电”的双回路供电中,断开“市电供电”回路,并挂牌; 3. 断开主变的低压进线开关,并退出母线,使开关与母线有明显的断开点; 4. 在退出母线后的低压进线开关上挂牌; 5. 起动发电机,并多巡视,确保发电机的正常运行和可靠的供电质量。 停电应急处理程序

医院信息系统故障应急预案

医院信息化系统应急预案为防止因医院信息系统出现故障而影响全院正常医疗秩序,确保患者在特殊情况下能够得到及时、有效地治疗,结合我院实际,特制定本预案,望各科室、各部门在应急情况下遵照执行。 1医院信息系统出现故障报告程序 当各工作站发现计算机访问数据库速度迟缓、不能进入相应程序、不能保存数据、不能访问网络、应用程序非连续性工作时,要立即向信息科报告。信息科工作人员对各工作站提出的问题必须高度重视,做好记录,经核实后及时给各工作站反馈故障信息,同时召集有关人员及时进行讨论,如果故障原因明确,可以立刻恢复的,应尽快恢复工作;如故障原因不明、情况严重、不能在短期内排除的,应立即报告院领导,在网络不能运转的情况下由院领导协调全院各部门工作,以保障全院医疗工作的正常运转。 2医院信息系统故障分级 2.1根据故障发生的原因和性质不同分为三类: 2.1.1一类故障:由于服务器不能正常工作、光纤损坏、主服务器数据丢失、备份硬盘损坏、服务器工作不稳定、局部网络不通、价表目录被人删除或修改、重点终端故障、规律性的整体、局部软件和硬件发生故障等造成的网络瘫痪。 2.1.2二类故障:由于单一终端软、硬件故障,单一病人信息丢失、偶然性的数据处理错误、某些科室违反工作流程引起系统故障。 2.1.3三类故障:由于各终端操作不熟练或使用不当造成的错误。

2.2针对上述故障分类等级,处理原则如下: 2.2.1一类故障——由信息科主任上报院领导,由医院组织协调恢复工作。 2.2.2二类故障——由网络管理人员上报信息科主任,由信息科集中解决。 2.2.3三类故障——由网络管理员单独解决,并详细登记维护情况。 3发生网络整体故障时的首要工作: 3.1当信息科一旦确定为网络整体故障时,首先是立刻报告院领导,同时组织恢复工作,并充分考虑到特殊情况如节假日、病员流量大、人员外出及医院有重大活动等对故障恢复带来的时间影响。 3.2当发现网络整体故障时,各部门根据故障恢复时间的程度将转入手工操作,具体时限明确如下: 3.2.130分钟内不能恢复——门诊挂号、住院登记、药房等部门转入手工操作。 3.2.26小时内不能恢复——各护士工作站、药房、120急救中心、手术室、医技检查转入手工操作(具体时间由信息科通知)。 3.2.324小时以上不能恢复——全院各种业务转入手工操作。 4各部门的具体协调安排: 4.1所有手工操作的统一启动时间须由信息科通知,相关部门严格按照通知时间协调各项工作,在未接到新的指示前不准私自操作计算机。

空调、电源常见故障处理工作手册

空调、电源常见故障处理工作手册 目录 一、基站交流电源部分常见故障的判断和处理 (2) 1、基站交流配电屏的主要特点和主要性能 (2) 2、基站交流配电屏常见的面板指示 (2) 3、基站交流电源常见的故障处理流程 (2) 3.1外电中断处理流程 (2) 3.2缺相处理流程 (2) 3.3反相故障处理流程 (3) 3.4中性线故障处理流程 (3) 3.5过压、欠压故障处理流程 (3) 3.6过流及短路故障处理流程 (3) 3.7雷击后出现的浪涌电压抑制现象故障处理流程 (3) 二、基站开关电源系统常见故障的判断和处理 (4) 1、开关电源的主要特点和主要性能 (4) 2、常见的故障和处理流程 (4) 2.1 整流模块功能设定 (4) 2.2整流模块常见故障的处理流程 (5) 3、直流配电模块常见的故障和处理流程 (6) 3.1输出电压过高或过低告警处理流程 (6) 3.2分路熔断器熔断或分路配电空气开关跳闸处理流程 (6) 4、蓄电池系统常见故障处理 (6) 4.1、电池主要特点和主要性能 (6) 4.3电池的常见故障和处理流程 (7) 5、监控模块常见的故障和处理流程 (8) 5.1监控模块同整流模块或整个开关电源系统通讯中断 (8) 5.2监控模块故障引发整个开关电源系统工作异常 (8) 三、基站空调系统常见故障的判断和处理 (8) 1、空调对电源的要求和注意事项 (8) 1.1空调对电源的要求 (8) 1.2空调维护注意事项 (8) 2、基站空调的常见故障和处理流程 (9) 2.1低压报警处理流程 (9) 2.2高压报警处理流程 (9) 2.3压缩机过载处理流程 (9) 四、附录 (9)

电梯故障应急处理方案

电梯故障应急处理方案 电梯故障维修应急处理方案 1. 接到报修,礼貌询问下列信息:具体地点、电梯编号、停置楼层、故障时间、故障现象、是否困人、报修人联系方式,立即记录,并迅速安排人员、工作,完成全部调度。 2. 迅速到位:电梯维修人员3 分钟内出发,30 分钟内到达(应急人员可采取最快捷方式),迅速并彻底检修故障,以最快速度恢复电梯正常使用。 3. 故障处理完毕后,详细填写电梯故障维修记录表。 4. 上报相关部门,总结经验,尽量避免故障再次发生。 水浸事故 电梯故障维修应急处理方案 1. 接到报告或巡查发现后,立刻通知相关物业管理部门,当值人员通过电梯轿厢内部对讲机,通知乘梯客人从最近楼层离开受事故影响的电梯。 2. 将受事故影响的电梯升到最高层,并关闭。 3. 迅速清理水浸楼层电梯口,防止电梯井被浸。 4. 立即上报主管人员和电梯责任承包商。 5. 尽快解决问题,恢复电梯正常运行,填写相关记录表。 电梯异常 电梯故障维修应急处理方案 1. 如电梯维护人员巡查中发现电梯安全缆有毛刺、断股,控制设备声音异常、有异味,轿厢升降不顺畅等现象,需立刻通知电梯当值部门,采取措施减少发生危险的可能。 2. 电梯当值人员接到报告,立即通过电梯轿厢内部对讲机,通知乘梯客人从最近楼层离开发生异常的电梯。 3. 关闭发生异常的电梯。 4. 立刻上报主管维修工程人员和电梯责任承包商。 5. 以最快速度检修电梯完毕,恢复电梯正常运行,填写相关记录表。注:如遇到其他复杂情况,应通知电梯公司专业人员到达处理。 7.5.2 电梯故障困人应急处理方案 凡遇电梯故障应第一时间通知专业电梯公司维修,并由工程部电 梯专业维修人员根据不同情况,依下列步骤先行释放被困乘客。 轿厢停于接近电梯门口的位置,且高于或低于楼面不超过0.5 米时: 电梯故障困人应急处理方案 1. 确定轿厢所在位置(根据楼数灯指示或小心开启外门检查)。 2. 关闭电源(在机房配电柜内)。 3. 用专门外门钥匙开启外门(钥匙由电梯员工随身携带,总钥匙在技术部钥匙柜内)。 4. 用人力开启轿厢门。

IT运维手册故障及处理

IT运维手册 第二篇硬件篇 一计算机章 ㈤常见问题 1主机 ⑴无法正常开机 ①硬盘灯亮 多为显示器或LCD排线问题,可插入系统引导盘看有无反应,若无反应,则为硬件问题,建议售后处理;若有反应,则为软件问题,可重装系统。 ②硬盘灯不亮 I电源问题 需更换电源和电池,多为电源适配器或电池损坏造成的提供电压不稳。可更换同型号电源线,排查故障。 II内存问题 拔插内存条或更换插槽。可能是内存条松动或自配内存条不兼容造成,若因不兼容,可通过更改BIOS设置解决。 III灰尘问题 笔记本长期不清洗,积压过多灰尘会造成静电或短路,可拆开外壳用吹风机清理灰尘。 IV主板问题 主板问题是造成不能开机最大可能因素,主板为集成电路,任何地方损坏都会造成硬盘无法通电,从而不能开机,建议去售后处理。 ⑵无法正常上网

①网络设置问题 此原因较多出现于需手动指定IP、网关、DNS服务器联网方式下,及使用代理服务器上网的,应仔细检查计算机的网络设置。 ②DNS服务器的问题 I当IE无法浏览网页时,可先尝试用IP地址来访问,如果可以访问,则为DNS的问题,造成DNS的问题可能是联网时获取DNS出错或DNS服务器本身问题,可手动指定DNS服务(地址可以是当地TSP提供的DNS服务器地址,也可用其它地方可正常使用DNS服务器地址。在网络的属性里进行(控制面板-网络和拨号连接-本地属性-TCP/IP协议-属性-使用下面的DNS服务器地址)。不用的ISP有不同的DNS地址。有时候则是路由器或网卡的问题,无法与ISP的DNS服务连接,这种情况可重启路由器或重新设置路由器。 II本地DNS缓存出现问题,为提高网站访问速度,系统会自动将已经访问过并获取IP地址的网站存入本地DNS缓存里,一旦继续访问此网站,则不再通过DNS服务器而直接从本地DNS缓存取出该网站的IP地址进行访问。所以,如果本地DNS缓存出现问题,会导致网站无法访问。可以在“运行”中执行ipconfig /flushdns来重建本地DNS缓存。 ③IE浏览器本身的问题 IE浏览器本身出现故障或IE被恶意修改破坏都会导致无法浏览网页,可尝试用上网助手“IE修复专家”来修复或者重装IE浏览器。 ④网络防火墙问题 如果网络防火墙设置不当,如安全等级过高、不小心把IE放进了阻止访问列表、错误的防火墙策略等,可尝试检查策略、降低防火墙安全等级或直接关掉试试是否恢复正常。

监控系统系统故障应急预案

监控系统系统故障应急预案 为了应急处置可能发生的矿井监控系统停运,造成重大事故,确保在事故发生时,干部职工能够做到及时、迅速、高效、有序地应急处理事故造成的危害,最大限度地减少人员伤亡、财产损失,依据国家有关法律、法规,特制定矿井大范围停电事故应急救援预案。 1、引发事故的隐患原因分析 1)、由于地面中心站故障(软件、硬件或病毒感染)导致整个系统瘫痪; 2)、由于监测分站故障导致区域性信号无法正常监测; 3)、由于传感器、断电器等调校不准或故障导致无法正常监测,发生误报、漏报或闭锁误动作、不动作; 4)、由于传输线路短路、抽线或其他原因导致地面中心站无法监测、监控现场设备; 2 组织机构及职责 2.1指挥机构及职责 2.1.1矿成立矿井矿井监控系统停运事故应急救援指挥部,作为矿应急处置事故的最高决策机构。 指挥长:**** 副指挥长:生产副矿长*** 机电副矿长*** 总工程师*** 安全副矿长*** 调度主任**** 后勤矿长*** 救护队队长88888 成员:8888 杨88888888 2.1.2应急处置指挥分工 (1)指挥长负责全面指挥,组织制定应急救援方案,并督促实施。 (2)副指挥长按照指挥部的分工,带领相关的业务部门组成现场抢救、医疗救护、物资供应、事故调查等工作小组,研究制定抢险救援方案实施办法和措施,全力以赴投入救灾工作。(3)对应急救援工作中发生的争议问题,由指挥部及时进行决断和紧急处理,同时指定专人向上级部门和相关领导汇报抢险救援工作进展情况。 (4)对外新闻发布,由指挥部明确专人负责,防止新闻报道混乱,影响抢险救援工作。2.1.3指挥部主要职责 (1)分析本单位存在的危险、危害因素及可能发生的事故并制定、批准预防措施和应急处置措施。 (2)教育和督促所有从业人员严格执行本单位的生产安全规章制度和安全操作规程,并向从业人员告知作业场所和工作岗位存在的危险因素、防范措施以及事故应急处置措施。(3)事故发生时,立即组织自救,防止事故扩大,努力将事故危害降低到最低限度。(4)分析判断事故、事件或灾情的受影响区域、危害程度及应急处置程序,确定相应警报级别、应急救援级别。 (5)批准现场应急处置方案。 (6)督察应急操作人员的行动,保护现场应急救援人员的安全。 (7)指挥救护、医疗工伤抢救、后勤支援等项工作,调度解决抢险救援所需资金、物资、设备等。 (8)宣布应急恢复、应急结束。 (9)对应急救援工作中发生的争议问题及时进行裁决和处理。 2.2工作机构及职责 2.2.1指挥部办公室 应急救援指挥部下设办公室,办公地点在矿调度室。

变电所常见故障应急处理方案

变电所常见故障应急处理方案

变电所常见故障应急处理方案 35kV GIS 开关柜: 1、断路器拒动 1.1应急处理 当远动操作失灵时,应立即安排巡检员到达现场。现场人员检查是否有拒动开关的故障信息。如果没有,可按电调命令在所内监控盘上进行操作,若操作失败,可在开关本体上当地电动操作,如果操作不成功,立即汇报电调,并通知车间生产调度。故障开关在非运营时间处理。 1.2、处理程序、方法及注意事项: 1.2.1 检查是否有SF6 气体泄漏,气压低于下限值,有无气室压力报警信号。 1.2.2 检查直流电源(控制、电机)的电压是否正常。若不正常,从直流盘馈出到断路器端子箱顺序查找。操作机构的检修必须先将合闸弹簧和分闸弹簧的能量释放掉。 1.2.3 检查控制、电机回路的空气开关有无烧损或接触不良。更换空气开关。 1.2.4 检查控制、电机回路是否断线、接触不良。紧固端子和接线。 1.2.5 检查操作机构辅助开关、限位开关转换是否到位。调整或更换辅助开关、限位开关。 1.2.6 检查分合闸线圈是否烧毁,有异味,用万用表测量线圈电

阻。更换分合闸线圈。 1.2.7 检查断路器是否已储能,电机是否烧毁,有异味,用万用表测量电机电阻。更换电机。 1.2.8 检查二次接线是否错误(新安装或检修变更二次接线后,首次投入时出现)。改正错误接线。 1.2.9 检查机构有无卡滞现象。注润滑油,处理卡滞点。 1.2.10 检查操作机构各轴连接销子是否脱落。安装连接销子。 2、断路器跳闸 2.1、应急处理 2.1.1 如发生进线开关跳闸, 故障开关退出运行,母联开关合闸,母线由一路电源供电。如引起所内一台35/0.4kV 的变压器故障或400V 母线失压时,自动切除该变电所供电区域内的三级负荷,400V 母联自投,若400V 母联自投不成功,由电调当值供电调度员经过SCADA 倒闸操作或现场变电所值班员采用手动倒闸操作,改变供电系统运行方式,由该变电所内另一台35/0.4kV 变压器承担该变电所供电区域内的一、二级负荷供电。 2.1.2 如发生环网出线开关跳闸,听从电调指挥,将故障位置隔离。待非运营时间处理故障。 2.2、程序、方法及注意事项: 2.2.1 进、出线断路器跳闸: 在控制信号盘上查看故障信息,判断保护类型。 1)差动保护跳闸。检查保护环网电缆,对保护装置进行试验、检

系统运维管理制度

系统运维管理制度

运维管理制度 系统运维管理制度(试行) (2018年8月版) 第一章总则 运维以技术为基础,通过技术保障产品提供更高质量的服务。在软件产品的整个生命周期中运维组都需要适时参与并发挥不同得作用,因此运维组工作内容和方向非常多。 运维目标是在服务出现异常时尽可能快速恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因;推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障是可以高效止损。 第一条为保障信息系统软硬件设备的良好运行,使运维技术人员工作制度化、流程化、规范化,特制订本制度。 第二条运维管理工作总体目标:立足根本促发展,开拓运维新局面。在办公系统运行推广时期,通过网络、桌面、系统等的运维,促进信息系统能够稳定可持续性的发展。 第三条运维管理制度的适用范围:运维全体人员。 第二章编制方法 第一条本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。

第二条本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 第三章运维部工作职责 第一条系统运维和技术支持 (1)根据公司业务的推进和发展目标,负责平台信息系统管理及数据交换策略的整体架构、对应用系统等技术开发方案的基础支撑,保障基础平台的稳定性和先进性。 (2)负责系统基础平台的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决; (3)会同项目实施,确认系统信息基础设备和软件数量、品牌规格、技术参数,确保项目有效推进实施。 (4)系统信息基础设备和软件操作规程、应用管理制度的制定,并负责监督执行。 (5)系统信息基础设备的软件安装、调试和验收,使用培训和维修保养。 (6)系统信息基础平台日常运行过程中信息安全和技术问题的协调解决,保障平台24小时安全稳定运行。 (7)负责平台系统管理及设备保密口令的设置、更新、保存。 (8)负责系统信息协同管理及协同数据交换策略研究新程序、新系统和软件改版升级工作。

信息系统的应急处理预案

一、总则 (一)、基本原则:明确责任、分级负责。按照“谁主管谁负责”的原则,建立和完善责任制度、协调管理机制和联动工作机制。根据部门职能,各司其职,落实到人,加强部门间的协调与配合,形成合力,共同履行应急处置工作的管理职责。 (二)、适用围:本预案适用于史丹利化肥有限公司网络与信息系统故障的应急响应工作。 二、日常准备工作 (一)、软资源备用:对重要信息资源需要有足够备份,并将备份存放于攻击和灾害不能及的地方。 (二)、设备备用:在工作现场有主板、硬盘、光驱、网线等备件,以及备用的外部设备。 (三)、电源备用:配置不间断UPS电源。不间断电源可在断电后维持工作3小时以上。 (四)、重要或大型系统中的关键设备和信息安全产品采用双机热备份。 三、应急处理流程 信息管理科人员在监控过程中发现或收到其他部门反馈不能正

常使用办公或业务应用系统等故障事件,相关软件、硬件的技术人员立即行动,初步查明原因(电力、服务器、存储、网络、应用系统软件等),并向科室、部门相关领导汇报。 部门领导在听取情况汇报后,根据事件的围、影响和紧急程度启动相应的专题预案。如果没有相应的专题预案,要根据情况迅速采取措施抑制事件的扩散,恢复系统运行。 信息管理科尽快通过OA、、短信平台、网上销售系统等方式向各科室、各分厂下发《应用系统暂停通知》或公告。各部门、各分厂要做好信息系统出现故障后的应急安排,尽力减小对公司正常业务的影响。 信息管理科人员进一步落实故障原因,根据事件的围、影响程度,采取应急措施,尽快恢复系统运行。 信息管理科在对系统完成修复后,在完成测试的基础上,经请示相关领导进行系统的启用,同时通过OA、网上销售系统、等向各部门、各分厂发布系统恢复公告。 四、事件分类 事件类型按照各种突发紧急事件的影响围,将史丹利网络与信息系统事件分成全局事件(总公司核心信息系统因电力、网络、软硬件等故障原因,导致全厂信息系统无法正常工作)和区域事件(SAP、网上销售系统、OA、BO、用友等系统故障,导致局部围的业务工作无法正常进行)。 五、全局事件处理

设备故障应急处理预案完整版本

设备故障应急处理预案 1 设备维修程序 1.1 设备需要维修,使用部门如实填报报修单,部门负责人签字后送工程部。 1.2 急需维修时,使用部门也可直接电话通知工程部。 1.3 工程部接报修单或电话后应在5分钟内及时派工,维修人员到达现场后,凭报修单进行维修。特殊情况可先维修,然后补报修单。 1.4 修复后使用部门应在报修单上签字认可。 1.5 无法修复时,维修工应将无法修复的原因写在报修单上,签字并送工程部负责人手中 1.6 工程部负责人根据情况,属零配件问题的,可按程序填报申报表;属技术原因无法修复的,在2-4小时内报主管总经理。 1.7 关于维修时现场维修应注意的礼仪,按《维修服务规范》执行。 2 公共部位巡查检修对于几个部门共同使用且较难界定由谁负责的公共部位设施设备,工程部派人进行巡查检修。每周一次,做好记录,一般故障由巡查员现场修复,重大故障由巡查员汇报当班负责人后安排检修。 当设备发生故障时 1、先停用故障设备,起动备用设备,防止故障设备的故障扩大及防止影响服务区域。 2、自动化的设备失灵后,即安排人员进行手动操作确保服务区域正常,与此同时再积极组织抢修。 3、降低设备的负荷,减少服务范围,尽力保证不影响对客服务。 4、如空调设备发生问题时,应严格控制新风量,确保空调区域的温度。 停电 一、事故停电 1、事故停电是指外供电线路发生事故造成停电,这种停电分大面积停电无法恢复和瞬间闪断两种。 2、事故停电由于属于突发事件,所以情况一般都非常紧急需要各部门协调工作。 3、配电值班人员发现停电后要第一时间询问供电部门停电原因,及时通知大堂副理、夜间要通知值班经理、部门经理、及酒店各相关值班岗位。

运维故障处理思路

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务就是否正常、查日志就是否报错、查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但就是原因还未定位。 经理过来了解情况:“系统恢复了不?”、“故障影响就是什么?”、“交易中断了不?”…… 运维人员赶紧敲键盘,写sql,瞧交易量;敲键盘,写命令,瞧系统资源、情况…… 最终,定位到问题原因就是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅就是报 警,还要协助故障定位” 3.完善故障应急方案——“应急方案就是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做“ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。 确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复

相关主题
文本预览
相关文档 最新文档