当前位置:文档之家› 时空信息云平台—运维规范

时空信息云平台—运维规范

时空信息云平台—运维规范
时空信息云平台—运维规范

时空信息云平台运维规范

目录

1.范围 (4)

2.规范性引用文件 (4)

3.术语及定义 (4)

3.1数据运维 (4)

3.2云平台 (5)

3.3资源池 (5)

4.运维管理体系 (5)

5数据运维 (5)

5.1矢量数据 (6)

5.1.1要素跟新 (6)

5.1.2范围更新 (6)

5.1.3版本更新 (7)

5.2影像数据 (8)

5.3文档/表格数据 (9)

5.4三维数据 (9)

5.5流数据 (9)

5.6元数据 (10)

6资源池运维 (10)

6.1服务实施对象和活动 (10)

6.2例行操作 (10)

6.2.1监控 (10)

6.2.2预防性检查 (10)

6.2.3常规作业 (10)

6.3响应支持 (11)

6.3.1事件驱动响应 (11)

6.3.2服务请求响应 (11)

6.4优化改善 (11)

6.4.1适应性改善 (11)

6.4.2增强性改善 (11)

6.4.3预防性改善 (12)

6.4.4咨询评估 (12)

7机房基础设施 (12)

7.1运行维护 (12)

7.1.1日常操作及监控分析 (12)

7.1.2数据与介质管理 (13)

7.1.3机房管理 (13)

7.1.4网络管理 (13)

7.1.5弱电管理 (14)

7.1.6服务器及系统变更 (14)

7.1.7配置管理 (15)

7.1.8事件与问题管理 (15)

7.2应急管理 (15)

7.2.1应急准备 (15)

7.2.2应急处置 (16)

8运维服务报告 (16)

8.1常规报告 (16)

8.2事件报告 (17)

8.3专题报告 (17)

1.范围

本规范阐述了智慧城市时空信息云平台的范围、用户、对象及体系架构。规定了时空新云平台规范性引用文件、术语和定义、配置管理、事件管理、变更管理、安全管理等,以及相应附录。

本标准适用于智慧时空信息云平台的运维管理,为时空信息云平台的运维提供依据。

2.规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件,凡是不注日期的文件,其最新版本(包括所有的修改单)适用于本文件。

基础地理信息标准数据基本规定(GB 21139—2007)

基础地理信息要素分类与代码(GB/T 13923-2006)

国家基本比例尺地形图更新规范(GB/T 14268-2008)

三维地理信息模型数据产品规范(CH/T 9015-2012)

三维地理信息模型生产规范(CH/T 9016-2012)

智慧城市时空基础设施-基本规定(征求意见稿)

信息技术安全技术信息安全管理体系要求(GB/T22080)

信息技术安全技术信息安全管理使用规则(GB/T22081)

信息技术软件维护规范(GB/T20157-2006)

3.术语及定义

3.1数据运维

智慧时空信息体系数据运维方式主要包括基础数据版本动态更新和时空大数据数据实时更新两类。整个时空大数据的动态更新将在制定统一规范的动态更新标准和机制的前提下,从数据采集、处理入库、服务发布等全流程保障数据实

时化动态更新。

3.2云平台

云平台指市时空信息云平台

3.3资源池

资源池是一组物理资源或一组虚拟资源的集合,可以从池中获取资源,也可将资源回收到池中。资源包括物理机、虚拟机、虚拟网络设备、物理网络设备和IP地址等。

4.运维管理体系

时空信息云平台运维管理由运维活动角色、运维管理组织结构、运维服务支撑系统、运维管理对象、运维管理流程和IT运维服务等组成。

运维活动角色由,运维服务商、运维管理部门、运维部门组成

运维服务包括安全管理、监控管理

运维管理对象包括运维部门和人员、IT服务商、IT用户、IT应用系统、IT 基础设施。

运维服务:数据运维服务、资源池运维服务、基础设施运维服务

5数据运维

为保证所有数据都能够追本索源,在导入变化数据对历史数据进行更新时,所有数据都需要创建历史基态版本,并添加时间基准。创建历史基本版本的方法:①将现势库变化的数据拷贝一份形成是历史数据,②将现势库的变化数据变成历史数据,重新创建一个空的当前基态变化数据。

5.1矢量数据

5.1.1要素跟新

矢量数据要素更新适用于要素级的更新,可记录数据的变化情况。矢量要素变化流程图如下:

5.1.2范围更新

矢量数据范围更新适用于比较大范围的矢量数据更新,并对该范围内的所有要素全部进行更新。具体更新的流程如下:

5.1.3版本更新

矢量数据版本更新适用于整个市范围内的矢量数据进行更新,可以将历史数据保存成一个版本,新版本的数据可作为新一版的数据导入到系统中,具体流程图如下:

5.2影像数据

市各地区每年会对区域内进行地表数据进行拍摄,而数据的更新相对矢量数据来说将变得更加简单,每更新一次都是对历史数据进行备份,对新的数据进行入库。同样的,对于影像数据需要根据图幅编号进行接边处理。具体的更新流程如下:

5.3文档/表格数据

文档/表格数据采用追加的方式进行更新,不删除原有数据,直接累加入库,形成时间序列的数据。

5.4三维数据

三维数据更新与影像数据更新一致,保存为不同版本的三维数据。

5.5流数据

流数据包括视频数据、音频的数据,多为从传感器接入的数据。采用追加的

方式进行更新,不删除原有数据,直接累加入库,形成时间序列的数据。

5.6元数据

元数据更新是由其他数据更新导致的。在数据更新时,提供手动录入基本信息(区域、生产日期、密级、比例尺、描述、提供单位)的功能,同时自动获取导入的系统时间。

6资源池运维

6.1服务实施对象和活动

对象为分布式的虚拟计算端资源(虚拟机、虚拟计算资源池)集群,充分利用集群汇聚的强大威力,对海量数据做分布式的处理,快速的完成数据分析工作。集群的维护特点是集中管理,集中控制,集中运维,有效监控,提前预警感知,为计算系统的正常而有序的运行提供坚实的基础。

6.2例行操作

6.2.1监控

虚拟计算资源监控主要监控虚拟计算资源的运行状况变化趋势及其指标。

6.2.2预防性检查

对于虚拟计算资源预防性的检查,包括:虚拟计算资源故障的提前预警,系统运行趋势的分析。安全日志的分析等。

6.2.3常规作业

对虚拟计算资源的常规作业参见表,包括但不限于:更换损坏的硬件、虚拟机监控器软件升级、日常的可靠性计划制定、制作虚拟机快照、虚拟机手工迁移、虚拟机资源配置更改、虚拟机备份克隆与恢复、虚拟机维护(创建、启动、停止、

删除、回收等操作)、虚拟资源池的扩容与资源再分配、制作与升级标准虚拟机模板、虚拟机映像维护、虚拟机转换、虚拟资源的访问控制与权限管理、制作系统运行状况报告。

6.3响应支持

6.3.1事件驱动响应

针对虚拟计算资源所依赖的硬件,网络及软件故障而进行的响应,包括但不限于解决物理服务器故障、解决物理网络设备故障、解决虚拟机监控器软件故障或者缺陷、虚拟机紧急迁移、虚拟资源池紧急扩容。

6.3.2服务请求响应

根据应用系统运行需要或需方、服务相关的请求,而进行的响应服务,包括但不限于:数据备份与恢复、虚拟机备份与恢复、系统扩容、虚拟机供应、虚拟机迁移回收变更、虚拟资源池变更。

6.4优化改善

6.4.1适应性改善

根据应用系统的要求,进行改善虚拟机计算资源cpu、内润容量、硬盘容量、网络的调整虚拟计算资源迁移。

6.4.2增强性改善

根据应用的特点和发展要求,以及数据量处理能力要求进行升级,扩容等物理服务器计算能力扩容,物理服务器内存扩容、物理服务器网络吞吐能力扩容虚拟计算资源高可用性增强、虚拟计算资源容错机制增强、虚拟计算资源备份

6.4.3预防性改善

根据对虚拟计算资源的运行记录和趋势的分析发现潜在的隐患而进行的改进作业,包括但不限于:根据系统监控得到的信息替换可能存在问题的内存,CPU,硬盘,网络设备等、根据系统的压力增长趋势主动对物理服务器的数量进行必要的扩容、根据系统的发展趋势对网络系统采取必要的扩容。

6.4.4咨询评估

通过对虚拟计算资源的运行记录、运行趋势进行分析,根据应用系统的特点和运行需求,提出物理计算设备、虚拟机监控器、虚拟计算资源池、虚拟机的改进建议和方案。

7机房基础设施

7.1运行维护

7.1.1日常操作及监控分析

未经许可,任何人不得随便使用电脑及相关设备。不得更换电脑硬件和软件,拒绝使用来历不明的软件和移动设备。

运维应采取各种监控措施,配备视频、语音、系统监控和报警工具,对影响信息系统正常运行的关键对象,包括机房环境、网络、通信线路、主机、存储、数据库、核心交易业务相关的应用系统、安全设备等进行监控。

主要监控指标具体如下:

a) 机房:电力状态、空调运行状态、消防设施状态、温湿度、漏水、人员及设备进出等;

b) 网络与通信:设备运行状态、中央处理器使用率、通信连接状态、网络流量、核心节点间网络延时、丢包率等;

c) 主机:设备运行状态、中央处理器使用率、内存利用率、磁盘空间利用率、通信端口状态等;

d) 存储:设备运行状态、数据交换延时、存储电池状态等;

e) 安全设备:设备运行状态、中央处理器使用率、内存利用率、端口状态、数据流量、并发连接数、安全事件记录情况等;

7.1.2数据与介质管理

配合数据部门,对核心业务数据进行周备份,并每季度进行恢复性测试。对设备和人员出入进行管理,进入机房应限制和监控其活动范围,并有专人陪同;未经批准不得接入生产环境。

7.1.3机房管理

对机房环境、供电、空调、消防、安防等基础设施的运行维护、设备和人员出入、机房工作人员等进行规范管理。

应指定机房管理负责人。

确保机房环境整洁和安全,包括:

a) 应定期检查防水、防雷、防火、防潮、防尘、防鼠、防静电等措施的有效性;

b) 应保持机房环境卫生,设备摆放合理,归类;

c) 不得随意出入机房。

d) 未经审批不得接入其它用电设备。

7.1.4网络管理

确保网络、系统的正常运行。

网络管理应包括:

a) 应保持网络设备的可用性,及时维修、更换故障设备;

b) 应负责网络系统的参数配置、调优;

c) 应定期对系统容量进行检查和评估;

d) 应定期检查网络设备的用户、口令及权限设置的正确性;

e) 应定期对整个网络连接进行检查,确保所有交换机端口处于受控状态;

f) 应对网络信息点进行管理,编制信息点使用表,并及时维护和更新,确保与实际情况一致。计算机网络跳线应整齐干净,跳线标识清晰;

g) 应制定网络访问控制策略,应合理设置网络隔离设施上的访问控制列表,关闭与业务无关的端口;编制文档并保持更新;访问控制策略的变更应履行审批手续。

7.1.5弱电管理

对弱电设备的综合管理,包括技术资料、档案的收集。同时,每月一次对弱电设备运行状况进行检查,并及时处理汇报问题。

7.1.6服务器及系统变更

不得在服务器上使用带有病毒和木马的软件、光盘和可移动存贮设备,使用上述设备前一定要先做好病毒检测;不得利用服务器从事工作以外的事情,无工作需要不得擅自拆卸服务器零部件,严禁更换服务器配套设备。不得擅自删除、移动、更改服务器数据;不得故意破坏服务器系统;不得擅自修改服务器系统时间。

使用空闲主机,对服务器系统补丁进行升级测试,运行平稳后,各服务器升级安装补丁,弥补系统漏洞;为服务器系统做好病毒及木马的实时监测,及时升级病毒库。

管理员对管理员账户与口令严格保密、重要数据库,网站,APP等服务器由研发配合定期修改密码,以保证系统安全,防止对系统的非法入侵。

任何无关人员不得擅自进入主机房,需要进入的须征得服务器管理人员同意。应注意保护机房内的设备和物品,未经允许的非管理人员不得擅自操作机房内设备。

严禁携带易燃易爆和强磁物品及其它与机房工作无关的物品进入机房,机房内严禁吸咽。

除管理员外,任何人不得随意改动服务器内系统及环境配置。

除系统管理员或授权参加系统管理的人员外,任何用户不得以任何方式获取

(或企图获取)超级用户权限。

7.1.7配置管理

明确配置管理负责人。

建立配置文档库,对服务器、存储、网络、安全设备,操作系统、应用软件、数据库等进行管理。

定期对配置进行备份及文档库归类。

及时检查并定期审计,对发现的不一致情况及时纠正修改。

7.1.8事件与问题管理

对运维事件的处理进行规范,对发生的所有事件,根据事件的影响程度和影响范围评估事件处理优先级并及时处理。

对所有事件响应、处理、结束等过程进行跟踪、监督及检查。

对问题进行分析、提出解决方案,通过变更管理审批后部署实施。

7.2应急管理

7.2.1应急准备

明确网络、系统等事件的应急指挥决策机制,负责网络与系统事件的预防预警、应急处置、报告和调查处理工作。

网络与系统应急管理应遵循“谁主管谁负责、谁运行谁负责”、“统一指挥、密切协同;注重预防、减少风险;科学处置、及时报告;以人为本、公平优先”的原则。

应急准备应符合如下要求:

a) 系统管理员、网络管理员、安全管理员等关键岗位应熟练掌握应急预案,能有效处置相关事件;

b) 在自身力量不足以满足应急要求的情况下,应与相关供应商签署服务保障协议。协议内容应包括双方联系人、联系方式、服务内容及范围、应急处理方式等。

应定期检查和评估协议的执行情况,确保服务保障措施落实到位,确保在应急处置中相关单位能提供及时有效的技术支持;

c) 应建立有效的应急通讯联络系统,确保信息畅通;

7.2.2应急处置

在发生网络与系统事件后,迅速采取应急措施,尽快恢复信息系统正常运行,如有重要情况应及时上报。

暂时无法确定事件原因、责任和结论的,应先给出事件的初步分析判断,并组织力量尽快查找原因,给出解决方法,采取整改措施。

8运维服务报告

运维服务实施中,供方应按要求进行服务报告编制、提交。服务报告通常分为常规报告、事件报告和专题报告三类。

8.1常规报告

常规报告包括的种类:提交分为定时、非定时,其内容包括但不限于:

a)报告名称、报告周期;

b)需方、供方相关信息;

c)服务综述;

d)服务对象(机房基础设施、网络、硬件、软件、数据),包括但不限于:

1)服务内容;

2)服务完成情况及下一步工作计划;

3)服务工作量;

4)相关绩效表现(事件量、问题数、变更实施、故障时间/次数、影

响的时间/次数等);

5)安全违规及考核实施情况;

6)服务对象情况分析、隐患及相关的纠正和预防措施(或建议);

7)重大事件(故障)的分析(对需方业务的影响和成本分析)、纠正

和预防措施及落实跟踪情况,相关变更和发布的绩效;

8)趋势分析和预警(响应事件量、问题数、故障时间/次数、影响业

务的时间/次数);

9)改进/提升建议。

e)满意度分析。

8.2事件报告

事件报告内容包括但不限于:

a)报告名称;

b)需方、供方相关信息;

c)事件描述;

d)事件发生时间/地点;

e)事件受理时间;

f)恢复时间;

g)事件处理结束时间;

h)事件提出人;

i)事件受理人;

j)事件处理人;

k)事件级别;

l)事件的影响程度、范围;

m)事件处理情况/工作量;

n)事件发生频度;

o)事件原因分析及建议;

p)后续改进计划。

8.3专题报告

内容包括但不限于:

a)报告名称;

b)需方、供方相关信息;

c)专题存在(或发生/灭失)所需要件(环境或机制) ;

d)专题对象(机房基础设施、网络、硬件、软件、数据),包括但不限于:

1)分析与解决方案建议;

2)对专题对象所造成的变动;

3)时间计划与各时间工作量安排;

4)对其他任何可能相关的服务内容的影响;

5)资源协调与配合;

6)保护或应急措施

安全监控运维管理平台系统

点击文章中飘蓝词可直接进入官网查看 安全监控运维管理平台系统 传统的运维管理系统已经不能满足企业对安全监控运维的需求,对于目前日益严重的网络安全问题,一套比较靠谱的安全监控运维管理平台系统非常重要。可以更好的实现对网络、应用服务器、业务系统、各类主机资源和安全设备等的全面监控,安全监控运维管理平台系统,哪家比较靠谱? 南京风城云码软件技术有限公司是获得国家工信部认定的“双软”企业,具有专业的软件开发与生产资质。多年来专业从事IT运维监控产品及大数据平台下网络安全审计产品研发。开发团队主要由留学归国软件开发人员及管理专家领衔组成,聚集了一批软件专家、技术专家和行业专家,依托海外技术优势,使开发的软件产品在技术创新及应用领域始终保持在领域上向前发展。 目前公司软件研发部门绝大部分为大学本科及以上学历;团队中拥有系统架构师、高级软件工程师、中级软件工程师、专业测试人员;服务项目覆盖用户需求分析、系统设计、代码开发、测试、系统实施、人员培训、运维整个信息化过程,并具有多个项目并行开发的能力。 安全监控运维管理平台系统功能主要表现以下方面: 服务器硬件状态监控:通过服务器主板IPMI协议,可以监控服务器风扇转速、机箱内部和CPU温度、电源电压、电源状态、CMOS电池容量、CPU、磁盘、内存、RAID卡等硬件状态。 监控操作系统运行状态:包括 linux、windows、Vmware等操作系统运行状态的监控,以及所运行的进程和服务等。 数据库和应用监控:包括MSSQL、ORACLE、MYSQL等数据库监控,WEB服务器,URL页面等状态监控。 线路监控:包括内部专网、互联网等线路的通断和质量、流量的监控。

运维管理系统方案

运维管理系统方案 概述 伴随着企事业网络规模的不断扩大,企事业服务器的增多,企事业管理的信息化,企事业网络管理也变的越来越重要。一旦网络、服务器、数据库、各种应用出现问题,常常会给企事业造成很大的损失。怎样能7x24小时检测网络系统的运行情况,避免各种故障的发生,改进传统的网络管理方式来适企事业信息化发展的需要? 因此,运维管理系统就有他的必要性。一个完备的运维管理系统能够提供7x24小时检测网络、服务器、数据库、各种应用系统,及时发现将要出现的问题,并通过短信、Email、声音报告给运维管理人员。运维管理人员就可以及时排除故障,避免造成重大损失。 运维管理系统的功能: 故障发现与警报; 记录日常运维日志信息; 服务器故障统计; 服务器软硬件信息统计; 服务进程管理; 将数据信息存储到数据库,并使用图形方式直观的展示出来; 权限、密码管理; 将数据生成报表。 运维管理系统的特点: 邮件和短信实时故障报警; B/S结构,能够通过web对远程服务器下达指令; 监控服务器和被监控服务器之间通过python socket来发送信息; 统计日常故障处理,以便下次出现同样故障时能够更快的解决问题; 实现自动化管理和自动化监控; 安全管理服务器性能; 操作流程统计与管理。

系统结构 运维管理系统采用B/S构架,运维管理人员随时随地可以对服务器进行管理、配置及故障处理。它是将部署在同一个局域网内的所有服务器统一管理,服务器之间的信息通讯、指令发送、运维管理都通过python来实现。监控服务器端负责采集、统计和分析数据,在数据出现异常时发送报警信息到管理员的email、手机中,并将错误日志存储到数据库中。 运维管理系统主要通过LAMP服务器、python编程、snmp和shell编程来实现。在被监控端安装python服务,并在被监控服务器上部署python程序和shell脚本用于接受监控服务器端指令、信息采集并发送会监控服务器端。监控服务器端部署python程序和LAMP服务器,用于发送指令、接受数据信息、存储数据、统计数据以及异常报警。 运维管理人员日常通过web浏览器远程登录监控管理系统,检测各被监控服务器的运行状态、服务状态、防火墙配置、进程信息、操作日志等信息。在出现异常时,通过运维系统可以查看到具体的异常服务器、进程等信息,并根据这些信息来处理异常。

it安全运维系统

点击文章中飘蓝词可直接进入官网查看 it安全运维系统 随着互联网大数据的发展,企业的IT系统会变得越来越庞大、复杂,it安全运维部门的职责也随之不断增加。但是与此同时,it安全运维还要降低IT成本,减少IT运维人员 的压力。这需要IT部门选择一个比较好的it安全运维系统来提供效率,提升系统性能, 并降低风险。 南京风城云码软件技术有限公司是获得国家工信部认定的“双软”企业,具有专业的 软件开发与生产资质。多年来专业从事IT运维监控产品及大数据平台下网络安全审计产品研发。开发团队主要由留学归国软件开发人员及管理专家领衔组成,聚集了一批软件专家、技术专家和行业专家,依托海外技术优势,使开发的软件产品在技术创新及应用领域始终 保持在领域上向前发展。 目前公司软件研发部门绝大部分为大学本科及以上学历;团队中拥有系统架构师、软 件工程师、中级软件工程师、专业测试人员;服务项目覆盖用户需求分析、系统设计、代码开发、测试、系统实施、人员培训、运维整个信息化过程,并具有多个项目并行开发的 能力。 自公司成立已来,本团队一直从事IT系统运维管理以及网络信息安全审计产品的开发,同时在电力、制造行业及政府部门的信息化、智能化系统的开发及信息安全系统的开发中 有所建树;在企事业协同办公管理、各类异构系统的数据交换与集成(企业总线ESB)、 电力行业软件系统架构设计、电网大数据量采集和数据分析、电能质量PQDF算法解析等应用方面拥有丰富开发的经验。特别在网络信息安全、IT应用系统的智能化安全监控领域具有独特的技术优势和深厚的技术储备。近年来随着企业的不断发展和技术的不断更新, 公司的开发团队正在拓展更多业务范围和更新的技术应用。

云平台运维建设方案

xxx区国土资源 一张图工程和服务平台系统基础支撑平台与运维保障平台 建 设 方 案

目录 1项目概述 (2) 1.1项目背景 (2) 1.2项目目标 (2) 1.3建设内容 (2) 2现状及需求分析 (3) 2.1信息化现状 (3) 2.2存在的问题 (4) 2.2.1运维保障面临主要问题 (4) 2.2.2现有保障手段不能满足需求 (4) 2.2.3管理运维问题 (5) 3方案总体设计 (6) 3.1设计原则 (6) 3.2总体架构设计 (7) 3.3实施思路 (7) 4虚拟桌面技术方案设计 (10) 5服务器虚拟化方案设计 (11) 6业务系统运维保障设计 (13) 6.1架构设计 (13) 6.2业务系统应急 (14) 6.3数据保障 (15) 6.4运维迁移 (15) 7项目实施计划 (16) 8项目组织保障 (17) 8.1工作领导小组 (17) 8.2项目专家小组 (17) 8.3项目技术小组 (17)

1项目概述 1.1项目背景 国土资源“一张图”和综合监管平台建设(以下简称“一张图”工程)是国土资源信息化“十二五”规划中的一项核心内容。 根据《国土资源部关于进一步运用现代科技信息手段规范和创新管理的指导意见》(国土资发〔2010〕81号)、《山东省国土资源系统‘一个平台、两个市场’建设方案的通知》(鲁国土资发〔2011〕33号)和《青岛市国土资源和房屋管理局关于加强信息化建设工作的意见的通知》(青土资房发〔2012〕465号)等一系列文件的要求,青岛市国土房管局xxx 分局拟开展xxx区国土资源一张图工程和服务平台系统基础支撑平台及运维保障平台建设,为一张图工程和服务平台系统搭建安全、可靠的基础设施环境,为全局信息化发展奠定坚实的基础。 1.2项目目标 基础支撑平台及运维保障平台的建设实现以下主要目标: (1)通过加强对业务内网、办公网、互联网的安全管理,实现生产数据和涉密信息的集中存放和管理,保证信息安全; (2)通过为32个乡镇国土所提供云端虚拟桌面服务,保障数据不在国土所用户的终端设备上落地的基础上,实现各项数据及业务应用的便捷接入,有效促进业务协 同; (3)通过运维保障平台的建设,为全区国土资源用户提供一致、高度可用、高度可扩展的服务,最大程度地减少系统停机,全面支持国土全系统的业务连续性; (4)通过云平台建设,充分整合已有资源,实现IT基础设施的集约化建设。 1.3建设内容 基础支撑平台及运维保证体系主要包括以下建设内容:

银讯IT安全运维管理平台技术白皮书

银讯IT安全运维管理平台技术白皮书 目录

一、产品理念 (22) 二、市场定位 (22) 三、产品架构 (22) 四、产品特点 (44) 4.1 模块化 (44) 4.2 自动发现 (44) 4.3 标准化 (44) 4.4 无插件 (44) 4.5 全IT架构 (44) 4.6 跨平台 (44) 4.7 扩展性 (55) 五、主要功能介绍 (55) 5.1 拓扑发现 (55) 5.2 设备管理 (66) 5.3 网络设备配置文件 (77) 5.4 IP地址管理 (99) 5.5 SNMP Trap接收与翻译 (1010) 5.6 Syslog接收与日志审计 (1111) 5.7 机房管理 (1212) 5.8 数据库管理 (1313) 5.9 中间件管理 (1414) 5.10 丰富的报表 (1515) 5.11 功能强大的告警 (1616) 六、系统运行环境 (2121)

一、产品理念 随着我国信息化建设的不断深入,企业的运作越来越依赖于计算机网络。如何高效地管理好网络和网络资源,以便确保企业的正常运作,是当前所有IT部门面临的主要问题。政府机构、企业组织对信息技术和系统的依赖性日益加强,IT 系统和业务应用的相互促进和融合,IT 管理走向面向服务的治理,是未来信息部门发展的发展核心。借助IT 规范管理体系和最佳实践方法的指导,更好的融合业务、管理、技术三者并同步提高,才能让信息部门抓住这次机遇,提升自己的潜在价值,驱动业务的快速发展。 银讯IT安全运维管理平台是通过归纳总结各行业IT运维管理需求,经过三年研发而成的综合IT运维管理系统。系统以网络管理和运维流程为基点,为 IT部门提供全面的企业级解决方案。通过此系统,在技术上对网络设备集中地进行性能采集和故障预警,大大减少了企业IT人员的日常工作量;在管理上,对日常运维工作进行规范化,合理化,提高决策的科学性。 二、市场定位 银讯IT安全运维管理平台面对的客户群为信息化程度比较高、日常IT 运维管理相对比较规范的政府行业、大中型企业等。目前,这类用户已经部署了一些IT 基础设施监控类的产品。但随着IT 系统重要性日益突显,他们迫切需要提高日常运维的规范化、流程化,量化运行质量和服务水平,提高IT 系统地运行效率,保障业务。因此从整体上讲,产品主要定位于行业市场,立足于提升行业用户的IT 服务质量从运营角度有效提升信息部门的服务质量和业务支撑能力。 三、产品架构 银讯IT安全运维管理平台是一个通用的IT基础设施和服务应用的管理平台。它从网络和应用的不同层次,收集与业务/服务相关的各种信息:网络设备信息、服务器内存、I/O 的使用情况,数据库、中间件的运行情况等;同时,内置的告警分析引擎对收集到的信息进行综合关联分析;

云计算中心运维管理制度

云计算中心运维管理制度 在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。数据中心运维管理就是:为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统的计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。数据中心运维管理主要肩负起以下重要目标:合规性、可用性、经济性、服务性等四大目标。 由于云计算的要求弹性、灵活快速扩展、降低运维成本、自动化资源监控、多租户环境等特性除基于ITIL的常规数据中心运维管理理念之外,以下运维管理方面的内容,也需要我们加以重点分析和关注。 一、理清云计算数据中心的运维对象 数据中心的运维管理指的是与数据中心信息服务相关的管理工作的总称。云计算数据中心运维对象共可分成5类: (1) 机房环境基础设施部分。这里主要指为保障数据中心所管理设备正常运行所必需的网络通信、电力资源、环境资源等。这部分设备对于用户来说几乎是透明的,因为大多数用户基本并不会关注到数据中心的风火水电。但是,这类设备如发生意外,对依托于该基础设施的应用来说,却是致命的。 (2) 在提供IT服务过程中所应用的各种设备,包括存储、服务器、网络设备、安全设备等硬件资源。这类设备在向用户提供IT服务过程中提供了计算、存储与通信等功能,是IT服务最直接的物理载体。 (3) 系统与数据,包括操作系统、数据库、中间件、应用程序等软件

资源;还有业务数据、配置文件、日志等各类数据。这类管理对象虽然不像前两类管理对象那样“看得见,摸得着”,但却是IT服务的逻辑载体。 (4) 管理工具,包括了基础设施监控软件、监控软件、工作流管理平台、报表平台、短信平台等。这类管理对象是帮助管理主体更高效地管理数据中心内各种管理对象,并在管理活动中承担起部分管理功能的软硬件设施。通过这些工具,可以直观感受并考证到数据中心如何管理好与其直接相关的资源,从而间接地提升的可用性与可靠性。(5) 人员,包括了数据中心的技术人员、运维人员、管理人员以及提供服务的厂商人员。人员一方面作为管理的主体负责管理数据中心运维对象,另一方面也作为管理的对象,支持IT的运行。这类对象与其他运维对象不同,具有很强的主观能动性,其管理的好坏将直接影响到整个运维管理体系,而不仅仅是运维对象本身。 二、定义各运维对象的运维内容 云计算数据中心资源管理所涵盖的范围很广,包括环境管理、网络管理、设备管理、软件管理、存储介质管理、防病毒管理、应用管理、日常操作管理、用户密码管理和员工管理等。要对每一个管理对象的日常维护工作内容有一个明确的定义,定义操作内容、维护频度、对应的责任人,要做到有章可循,责任人可追踪。实现对整个系统的全生命周期的追踪管理。 三、建立信息化的运维管理平台系统 云计算数据中心的运维管理应从数据中心的日常监控入手,事件管理、

运维监控管理平台建设方案(参考)

IT运维监控管理平台 建设方案 XXXXXXX

目录 第1章概述 (4) 1.1 建设背景 (4) 1.2 建设目标 (4) 1.3 建设思路 (5) 第2章系统总体设计 (6) 2.1 总体架构 (6) 2.2 设计原则 (7) 2.3 运维管理体系架构设计 (8) 2.3.1 系统总体架构设计 (8) 2.3.2 监控采集层 (9) 2.3.3 数据处理层 (9) 2.3.4 运行展现层 (9) 2.4 系统技术路线 (10) 2.4.1 采用Java语言开发 (10) 2.4.2 采用J2EE框架 (11) 2.4.3 采用WebService进行数据互连互通 (11) 2.4.4 数据库技术 (13) 2.4.5 性能控制 (14) 2.4.6 开发、运行环境 (14) 2.5 应用接口总体设计 (14) 2.5.1 系统内部集成接口 (14) 2.5.2 与基础运维管理工具的集成接口 (15) 2.5.3 与ITSM系统的集成接口 (15) 2.5.4 与相关外部系统的统一身份认证与单点登录接口 (15) 2.6 系统安全设计及部署 (16) 2.6.1 输入检验 (16) 2.6.2 GET请求和Cookie中的敏感数据 (16)

2.6.3 防通过嵌入标记实现的攻击 (16) 2.6.4 防口令猜测功能 (17) 2.6.5 页面和字段级的权限控制 (17) 2.6.6 系统安全架构 (17) 第3章系统功能设计 (18) 3.1 动环监控 (18) 3.1.1 配电柜监测 (18) 3.1.2 配电开关及电流监控 (18) 3.1.3 发电机监控 (19) 3.1.4 ATS监测 (19) 3.1.5 STS监测 (19) 3.1.6 UPS监控子系统 (20) 3.2 统一门户子系统 (20) 3.2.1 信息主管领导内容展示 (21) 3.2.2 运维人员内容展现 (21) 3.2.3 一般用户内容展现 (22) 3.3 IT运行监控子系统 (22) 3.3.1 基础平台功能 (22) 3.3.2 网络设备管理 (24) 3.3.3 服务器监控管理 (27) 3.3.4 存储监控管理 (30) 3.3.5 数据库监控管理 (30) 3.3.6 中间件监控管理 (31) 3.3.7 web与应用监控管理 (32) 3.3.8 虚拟化监控管理 (33) 3.3.9 IP地址管理管理 (34) 3.3.10 信息点管理 (35) 3.3.11 告警监控管理与转发处理 (36) 3.3.12 综合监控管理 (37)

运维应用管理平台运维服务介绍

1.1 系统维护服务要求 1.1.1 维护服务要求 1.应答方在保修期内应提供免费的系统维护服务,保修期为自系统终验证 书签署之日第二天起12个月。 2.应答方应根据系统维护服务的范围和要求,提出针对广东移动掌上运维 应用管理平台的后期维护方案,包括故障处理的流程、响应时间、管理 体制、维护人员和工具配备等。 3.应答方应提供7x24小时的现场维护人员(不少于3人)。应答方的技术 支持人员应具有不少于三年开发和维护经验,应答方应标时必须提供详 细的维护人员名单,名单中必须列明各人员的学历、工作经验等信息, 并经由需求方确认。 4.应答方支持终端侧重要需求的快速响应,应答方有责任在需求方要求的 时间内支持重要需求的快速开发和部署上线。 5.应答方为系统故障的第一响应方。应答方有责任在需求方要求的时间内 首先响应需求方的要求,并负责召集设备供应商共同对系统软、硬件设 备的安装、联通测试及运行维护中出现的问题进行及时的处理和故障排 除。 6.应答方应提供详细的故障处理方案,该方案必须经需求方评审通过。故 障处理方案必须针对不同故障等级分别制定,故障等级划分包括但不限 于: 紧急故障:系统核心业务瘫痪,无法提供服务; 严重故障:系统核心业务仍能提供服务,但是性能受到严重影响; 一般故障:系统核心业务不受影响; 7.在紧急故障发生时,应答方应在15分钟内响应,1小时之内赶赴现场, 2小时内对故障进行紧急处理,恢复业务基本运行。因不可抗力致使应 答方未按时到达现场除外。 8.在严重故障发生时,应答方应在30分钟内响应,2小时之内赶赴现场, 4小时内对故障进行紧急处理,恢复业务基本运行。因不可抗力致使应

2020年(安全生产)银讯IT安全运维管理平台技术白皮书

(安全生产)银讯IT安全运维管理平台技术白 皮书

银讯IT安全运维管理平台技术白皮书 目录 一、产品理念2 二、市场定位2 三、产品架构2 四、产品特点4 4.1 模块化4 4.2 自动发现4 4.3 标准化4 4.4 无插件4 4.5 全IT架构4 4.6 跨平台4 4.7 扩展性5 五、主要功能介绍5 5.1 拓扑发现5 5.2 设备管理6 5.3 网络设备配置文件7 5.4 IP地址管理9 5.5 SNMP Trap接收与翻译10 5.6 Syslog接收与日志审计11

5.7 机房管理12 5.8 数据库管理13 5.9 中间件管理14 5.10 丰富的报表16 5.11 功能强大的告警17 六、系统运行环境22 一、产品理念 随着我国信息化建设的不断深入,企业的运作越来越依赖于计算机网络。如何高效地管理好网络和网络资源,以便确保企业的正常运作,是当前所有IT部门面临的主要问题。政府机构、企业组织对信息技术和系统的依赖性日益加强,IT系统和业务应用的相互促进和融合,IT管理走向面向服务的治理,是未来信息部门发展的发展核心。借助IT规范管理体系和最佳实践方法的指导,更好的融合业务、管理、技术三者并同步提高,才能让信息部门抓住这次机遇,提升自己的潜在价值,驱动业务的快速发展。 银讯IT安全运维管理平台是通过归纳总结各行业IT运维管理需求,经过三年研发而成的综合IT运维管理系统。系统以网络管理和运维流程为基点,为IT部门提供全面的企业级解决方案。通过此系统,在技术上对网络设备集中地进行性能采集和故障预警,大大减少了企业IT人员的日常工作量;在管理上,对日常运维工作进行规范化,合理化,提高决策的科学性。 二、市场定位 银讯IT安全运维管理平台面对的客户群为信息化程度比较高、日常IT运维

云计算数据中心的运维管理

云计算数据中心的运维管理 现代信息中心已成为人们日常生活中不可缺少的部分,因此信息中心机房设备的运行正常与否就非常关键。在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。加强对云计算运维管理的要点以及相应改进方面措施的研究与探讨,以此不断提高IT运维质量,实现高效的运维管理。这就给运维是否到位提出了严格要求。 1 运维在机房中的地位 在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。数据中心运维管理是,为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统地计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。数据中心运维管理主要肩负合规性、可用性、经济性、服务性等四大目标。 在信息中心机房配备有运维人员,但大都是“全才”的,即什么都管,尤其是对供电系统大都是由主机运维的人员代管。当电源系统出故障时,此代管人员一问三不知,甚至连配电柜门都没开过。这实际上就是把机房的运维放在了一个次要的地位。 当然也有的地方有所分工,看似重视,实际上也没得到真正地重视。比如说机房设备长时间一直运行正常,这时如果运维人员提出要增添运维方面的测量设备,有的领导就认为多余,很难得到批准。但他不知道机房设备所以长时间一直运行正常,正是由于这些运维人员的细心维护和努力保养所获得的。并不是这些人员每天闲着无事可干,他们的这些工作一般是领导看不见的。比如同样多款的UPS在同样的环境条件下,在某卫星地面站就极少出故障,而在同系统别的地方机房同一家同规格的机器就故障连连。原来是前者的运维人员每天都在细心观察和分析机器面板LCD上显示的数据,一旦发现异常苗头及时采取措施;而后者只限于每天抄写这些数据就算完成任务,使异常苗头不断积累,以致于导致故障。比如断路器在额定闭合状态发现触点处温度高了,就要检查是不是电流过大到超过额定值,如果不是就要检查触点接触是否牢靠,是否需要再紧固一下。这样一来,故障隐患就排除了。如果一直不管不问久而久之就会导致跳闸而使系统崩溃。这都是一些小的动作,都是在巡查中顺便做的事情。所以同是运维人员在巡查,但前者在做事而后者只是走马观花。这就是数据中心可靠与不可靠的区别。 运维人员就像幼儿园的保育员和老师。孩子交到幼儿园后,起主要作用的就是保育员和老师,这时保育员和老师就是主体。机器就好比是幼儿园的孩子,孩子是否健康成长,机器是否正常运行,除去本身的健康(可靠性质量)状况外,那就是运维人员的责任了。由于云计算的要求弹性、灵活快速扩展、降低运维成本、自动化资源监控、多租户环境等特性,除基于ITIL(IT 基础设施库)的常规数据中心运维管理理念之外,以下运维管理方面的内容,需要我们加以重点关注。 2 云计算数据中心运维管理的要点 (1)理清云计算数据中心的运维对象 数据中心的运维管理指的是与数据中心信息服务相关的管理工作的总称。云计算数据中心运维对象一般可分成5大类: ①机房环境基础设施 这里主要指的是为保障数据中心所管理的设备正常运行所必需的网络通信、供配电系统、环境系统、消防系统和安保系统等。这部分设备对于用户来说几乎是透明的,比如大多数用

浅析构建信息安全运维体系

浅析构建信息安全运维体系 周晓梅-201071037 2018年11月20日 摘要:交通运输行业经过大规模信息化建设,信息系统数量成倍增加,业务依赖性增强,系统复杂度提高,系统安全问题变得更加突出、严重。建设系统信息安全运维管理体系,对保证交通运输行业信息系统的有效运行具有重要意义。 关键词:信息系统安全运维体系构建 安全不仅仅是一个技术问题,更是一个管理问题。实际上,在整个IT产品的生命周期中,运营阶段占了整个时间和成本的70% - 80% 左右,剩下的时间和成本才是花费在产品开发(或采购)上面。以往我们听说"三分技术、七分管理"是突出管理的重要性,而这个"管理"则是大部分的精力花费在"运营"方面。随着信息安全管理体系和技术体系在政府或企业领域的信息安全建设中不断推进,占信息系统生命周期70% - 80%的信息安全运维体系的建设已经越来越被广大用户重视。尤其是随着信息系统建设工作从大规模建设阶段逐步转型到“建设和运维”并举的发展阶段,政府或企业运维人员需要管理越来越庞大的IT系统这样的情况下,信息安全运维体系建设已经被提到了一个空前的高度上。 任何为了信息安全所采取的任何安全措施,不管是技术方面的还是管理方面的,都是为了保障整个信息资产的安全,安全运维体系就是以全面保障信息资产安全为目的,以信息资产的风险管理为核心,建立起全网统一的安全事件监视和响应体系,以及保障这一体系正确运作的管理体系。 一、面临的问题 “十一五”以来,我国交通运输行业和部级信息化建设工作发展迅猛,取得了长足的进步,而部级信息化建设和管理工作中存在的一些问题和矛盾也日益凸显。当前部级信息化项目来源较多、资金筹措渠道复杂、建设和运行维护单位众多,而信息化标准规范体系不完善,由于缺乏有效的技术管理规范,非基本建设项目的建设实施还存在管控盲区,现有标准规范贯彻执行不足,系统建设实施过程中存在安全和质量风险,并对系统运行维护形成障碍,整体运行安全存在隐

云计算中心运维管理制度

云计算中心运维管理制度 现代信息中心已成为人们日常生活中不可缺少的部分,因此信息中心机房设备的运行正常与否就非常关键。在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。加强对云计算运维管理的要点以及相应改进方面措施的研究与探讨,以此不断提高IT运维质量,实现高效的运维管理。这就给运维是否到位提出了严格要求。 1 运维在机房中的地位 在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。数据中心运维管理是,为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统地计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。数据中心运维管理主要肩负合规性、可用性、经济性、服务性等四大目标。 在信息中心机房配备有运维人员,但大都是“全才”的,即什么都管,尤其是对供电系统大都是由主机运维的人员代管。当电源系统出故障时,此代管人员一问三不知,甚至连配电柜门都没开过。这实际上就是把机房的运维放在了一个次要的地位。 当然也有的地方有所分工,看似重视,实际上也没得到真正地重视。比如说机房设备长时间一直运行正常,这时如果运维人员提出要增添运维方面的测量设备,有的领导就认为多余,很难得到批准。但他不知道机房设备所以长时间一直运行正常,正是由于这些运维人员的细心维护和努力保养所获得的。并不是这些人员每天闲着无事可干,他们的这些工作一般是领导看不见的。比如同样多款的UPS在同样的环境条件下,在某卫星地面站就极少出故障,而在同系统别的地方机房同一家同规格的机器就故障连连。原来是前者的运维人员每天都在细心观察和分析机器面板LCD上显示的数据,一旦发现异常苗头及时采取措施;而后者只限于每天抄写这些数据就算完成任务,使异常苗头不断积累,以致于导致故障。比如断路器在额定闭合状态发现触点处温度高了,就要检查是不是电流过大到超过额定值,如果不是就要检查触点接触是否牢靠,是否需要再紧固一下。这样一来,故障隐患就排除了。如果一直不管不问久而久之就会导致跳闸而使系统崩溃。这都是一些小的动作,都是在巡查中顺便做的事情。所以同是运维人员在巡查,但前者在做事而后者只是走马观花。这就是数据中心可靠与不可靠的区别。 运维人员就像幼儿园的保育员和老师。孩子交到幼儿园后,起主要作用的就是保育员和老师,这时保育员和老师就是主体。机器就好比是幼儿园的孩子,孩子是否健康成长,机器是否正常运行,除去本身的健康(可靠性质量)状况外,那就是运维人员的责任了。由于云计算的要求弹性、灵活快速扩展、降低运维成本、自动化资源监控、多租户环境等特性,除基于ITIL(IT基础设施库)的常规数据中心运维管理理念之外,以下运维管理方面的内容,需要我们加以重点关注。 2 云计算数据中心运维管理的要点 (1)理清云计算数据中心的运维对象 数据中心的运维管理指的是与数据中心信息服务相关的管理工作的总称。云计算数据中心运维对象一般可分成5大类: ①机房环境基础设施 这里主要指的是为保障数据中心所管理的设备正常运行所必需的网络通信、供配电系统、环境系统、消防系统和安保系统等。这部分设备对于用户来说几乎是透明的,比如大多数用户都不会忽略数据中心的供电和制冷。因为这类设备如果发生意外,对依托于该基础设施的应用来说是致命的。 ②数据中心所应用的各种设备 这些设备包括存储、服务器、网络设备和安全设备等硬件资源。这类设备在向用户提供IT 服务过程中提供了计算、存传输和通信等功能,是IT服务最核心的部分。 ③系统与数据 这部分包括操作系统、数据库、中间环节和应用程序等软件资源,还有业务数据、配置文件、日志等各类数据。这类管理对象虽然不像前两类管理对象那样“看得见,摸得着”,但却是IT服务的逻辑载体。 ④管理工具 这部分包括基础设施监控软件、IT监控软件、工作流管理平台、报表平台和短信平台等。 这类管理对象是帮助管理主体更高效地管理数据中心内各种管理对象的工作情况,并在管理活动中承担起部分管理功能的软硬件设施。通过这些工具,可以直观感受并考证数据中心如何管理好与其直接相关的资源,从而间接地提升了可用性与可靠性。 ⑤人员管理 人员管理包括数据中心在内的技术人员、运维人员、管理人员以及提供服务的厂商人员的管理。 人员一方面作为管理的主体负责管理数据中心的运维对象,另一方面也作为管理的对象,支持IT的运行。这类对象与其他运维对象不同,具有很强的主观能动性,其管理的好坏将直接影响到整个运维管理体系,而不仅仅是运维对象本身。 (2)定义各运维对象的运维内容 云计算数据中心资源管理所涵盖的范围很广,包括环境管理、网络管理、设备管理、软件管理、存储介质管理、防病毒管理、应用管理、日常操作管理、用户密码管理和员工管理等。这就需要对每一个管理对象的日常维护工作内容有一个明确的定义,定义操作内容、维护频度、对应的责任人,要做到有章可循,责任人可追踪。实现对整个系统全生命周期地追踪管理。 (3)建立信息化的运维管理平台系统和IT服务管理系统 云计算数据中心的运维管理应从数据中心的日常监控入手,事件管理、变更管理、应急预案管理和日常维护管理等方面全方位地进行数据中心的日常监控。实现提前发现问题、消除隐患,首先要有完整的、全方位实时有效的监控系统,并着重监控数据的记录和技术分析。 数据中心的业务可以概括为:通过运行系统来向客户提供服务。没有信息系统的支撑来运行

(完整word版)云平台运维建设方案

xxx 区国土资源 一张图工程和服务平台系统 基础支撑平台与运维保障平台





目录
1 项目概述 ................................................................................................................................... 2
1.1 项目背景 ................................................................................................................................. 2 1.2 项目目标 ................................................................................................................................. 2 1.3 建设内容 ................................................................................................................................. 2
2 现状及需求分析 ........................................................................................................................ 3
2.1 信息化现状 ............................................................................................................................. 3 2.2 存在的问题 ............................................................................................................................. 4
2.2.1 运维保障面临主要问题 ................................................................................................. 4 2.2.2 现有保障手段不能满足需求 ......................................................................................... 4 2.2.3 管理运维问题 ................................................................................................................. 5
3 方案总体设计............................................................................................................................6
3.1 设计原则 ................................................................................................................................. 6 3.2 总体架构设计 ......................................................................................................................... 7 3.3 实施思路 ................................................................................................................................. 7
4 虚拟桌面技术方案设计 .......................................................................................................... 10
5 服务器虚拟化方案设计 .......................................................................................................... 11
6 业务系统运维保障设计 .......................................................................................................... 13
6.1 架构设计 ............................................................................................................................... 13 6.2 业务系统应急 ....................................................................................................................... 14 6.3 数据保障 ............................................................................................................................... 15 6.4 运维迁移 ............................................................................................................................... 15
7 项目实施计划.......................................................................................................................... 16
8 项目组织保障.......................................................................................................................... 17
8.1 工作领导小组 ....................................................................................................................... 17 8.2 项目专家小组 ....................................................................................................................... 17 8.3 项目技术小组 ....................................................................................................................... 17

IT运维管理平台

简单运维 轻松管理 统一门户管理 云基础架构管理 管理 统计报表 无线管理 业务服务管理 数据中心管理 @ 告警管理

RIIL-BMC,综合业务管理平台 以IT业务价值为核心,帮助企业构建可视、智能的IT一体化管理动态模型,通过端到端海量IT数据的实时透视与分析,洞察企业IT正在发生的一切,为企业IT管理提供决策依据与最佳实践指引,提升企业IT运营管理水平,挖掘IT 业务价值。 统一门户管理 整合运维数据,打造个性化的信息看板 Portal一体化门户定位于连接RIIL各产品、各模块的统一访问门户,为用户提供整合的资源信息、统一的用 户登录认证、个性化的管理界面等服务 业务服务管理 业务运行状况有效度量与数据分析,快速定位业务故障点 业务服务管理帮助IT管理者全局掌握业务的运行状态和健康水平,了解动态变化趋势,快速查明问题源,降 低运营风险。同时可直观反映IT资源的运行状况对应用系统、核心业务以及用户的影响,遇到故障帮助IT人

业务体验分析 基于嗅探技术获取用户体验数据,提升用户满意度 关注用户满意度,实时监测各关键应用性能,提供详细的性能和故障现场数据,分析业务交易服务质量,构建以业务为中心的业务管理视图。帮助客户了解其业务应用系统的使用情况及最终用户的体验情况。 告警管理 智能化故障关联分析,提升故障处理时效 告警管理帮助管理人员实时掌握所有业务系统的运行状态,一旦发现异常,快速定位问题根源点,并主动通知责任人,采用直观的可视化方式进行故障分析管理,降低管理人员的工作难度,提升整体故障处理的工作效率。 无线管理 多厂商,有线、无线一体化管理 支持对锐捷、H3C、华为、Cisco、Aruba、Juniper、中兴等无线设备的的全方位管理。图形化展现无线设备及用户分布情况,用户体验好坏直观可视

平台安全运维保障方案

平台运维保障方案 1.目的 为了保障平台各项业务的正常开展,确保信息系统的正常运行,规范信息系统日常操作及维护阶段安全要求,特制订此方案。 2.系统日常操作及维护管理 2.1.建立双向联动责任人机制 所有涉及到业务平台的资源,包括主机操作系统、应用系统、网络设备和安全设备,指定电信接口人和支撑单位接口人双向联动,由电信公司指定维护接口人专门负责对接支撑单位的技术负责人和维护人员,电信公司的接口人对支撑单位的日常工作进行监督,支撑单位对业务系统的日常操作和维护按照本方案进行记录,做到责任到人,保证各个业务平台的正常运行。 2.2.操作系统日常操作及维护 (1)必须严格管理操作系统账号,定期对操作系统账号和用户权限分配进行检查,系 统维护人员至少每月检查一次,并报信息技术管理员审核,删除长期不用和废弃 的系统账号和测试账号。 (2)必须加强操作系统口令的选择、保管和更换,系统口令做到: ●长度要求:8位字符以上; ●复杂度要求:使用数字、大小写字母及特殊符号混合; ●定期更换要求:每90天至少修改一次。 (3)支撑单位维护人员需定期进行安全漏洞扫描和病毒查杀工作,平均频率应不低于 每月一次,重大安全漏洞发布后,应在3个工作日内进行上述工作。为了防止网 络安全扫描以及病毒查杀对网络性能造成影响,应根据业务的实际情况对扫描时 间做出规定,需安排在非业务繁忙时段。技术负责人应为每个系统指定专门的系 统维护人员,由系统维护人员对所负责的服务器进行检查,至少每天一次,确保 各系统都能正常工作;监控系统的CPU利用率、进程、内存和启动脚本等使用情况。

(4)当支撑单位维护人员监测到以下几种已知的或可疑的信息安全问题、违规行为或 紧急安全事件系统时,应立即报告技术负责人,同时采取控制措施,并进行记录: a)系统出现异常进程; b)CPU利用率,内存占用量异常; c)系统突然不明原因的性能下降; d)系统不明原因的重新启动; e)系统崩溃,不能正常启动; f)系统中出现异常的系统账户; g)系统账户口令突然失控; h)系统账户权限发生不明变化; i)系统出现来源不明的文件; j)系统中文件出现不明原因的改动; k)系统时钟出现不明原因的改变; (5)系统日志中出现非正常时间登录,或有不明IP地址的登录; (6)系统维护人员对操作系统的任何修改,都需要进行备案,对操作系统的重大修改 和配置(如补丁安装、系统升级等操作)必须向技术负责人提交系统调整方案,由信息技术管理员审核通过后方可实施。操作系统的配置和修改必须在非业务时间进行,重大调整必须提前准备应急预案和回退方案。 (7)保证操作系统日志处于运行状态,系统维护人员应定期对日志进行审计分析,至 少每月审计一次,重点对登录的用户、登录时间、所做的配置和操作做检查,在发现有异常的现象时及时向信息技术管理员报告。 (8)系统维护人员应设置操作系统日志归档保存功能,历史记录保持时间不得低于一 年。 2.3.业务系统安全日常操作及维护 (1)新的应用系统在正式上线运行前应由技术负责人进行安全检查,检查通过方能正 式运行使用。严禁在不检查或检查未通过的情况下将应用部署到正式环境中。检查的内容包括: a)检查应用系统的软件版本;

相关主题
文本预览
相关文档 最新文档