为适应业务发展需要,近年来大庆炼化公司进行了大规模的信息化体系建设,引进大量的网络设备、服务器、数据库、存储设备等软硬件设施。这些软硬件设施的投入,极大地推动了大庆炼化公司信息化建设的进程,但伴随而来的问题是如何将这些应用系统以及硬件设备高效地利用起来。
网络系统的运行维护与管理,成为保证业务系统稳定可靠运行的必要手段。由于人力有限,系统维护任务繁重,大庆炼化公司的技术人员长期处于满负荷状态,严重影响工作效率。为此,大庆炼化公司迫切需要使用一体化智能运维平台,来保证业务的正常运行。
1 项目背景
大庆炼化公司是中国石油天然气股份有限公司所属地区分公司,作为各类用油的生产地,其网络规模比较大,是由多区域网络共同组成。本运维项目采集的IT资源较多,现场采用分布式的部署架构,每个区域进行分布式采集。每个现场部署两个采集器,对不同区域采集后再进行总体整合。
大庆炼化公司本次运维项目涉及设备约800左右,机房2个,设备类型主要包括约700个网络设备和服务器、70个数据库、4台存储。设备厂商众多、设备型号各异,运维难度大。若出现网络不稳定的情况,IT运维人员无法实时掌握设备的运行状态及使用情况。
2 现状描述及需求分析
以往的运维,主要面临以下几点问题:
1. IT网络环境中,网络设备和设备厂商较多,运维压力较大;
2. 炼化公司的存储设备往往都放在机房使用,IT运维人员很难关注到存储的使用情况以及组件的运转情况;
3. 运维人手少,故障通知时间滞后,故障处理不及时,影响业务的正常运行;
4. 网络设备配置文件多而杂,无法了解具体配置内容。
为此,大庆炼化公司需要通过一体化智能运维平台提供的拓扑管理和资源管理,对设备进行实时监控。
3 解决方案
针对于目前大庆炼化公司遇到的运维现状,勤智运维提出部署 IT一体化智能运维管理平台。
监控系统部署:
主要功能模块,包括资源监控管理、拓扑管理、告警管理、业务管理、配置文件管理、巡检管理。
监控的资源,主要包括网络设备、服务器、数据库、存储。网络设备类型包括华为、H3C、山石共约700台,存储类型包括HP、IBM、华为四台。
拓扑展示
存储
静态3D机房:展示大庆炼化公司真实的机房环境,包括机房中机柜和服务器的位置。
静态3D机房部署
4 用户收益
本运维项目,为大庆炼化公司提供了约700个网络设备的监控以及与重要业务有关的网络设备中配置文件的管理,使故障处理变得更加及时高效。IT运维人员在电脑前可以实时掌握设备运行情况,达到事前管理的效果。
大庆炼化公司信息中心的冷主任说:“在之前的运维中,每台设备的资源利用和运行情况都很模糊,无法准确掌握每台网络设备的健康情况,即使查看也是登录web管理网址去了解。现在,只需要登录一次就可以了解到所有设备的相关信息,而且监控到的指标多,数据非常准确。”
5 案例亮点
通过配置短信猫,帮助用户及时了解告警的概要信息。
静态3D机房功能,帮助IT运维人员了解每台设备所处的机房位置,当发生告警时及时定位。
配置文件管理支持与重要业务有关的网络设备配置文件的管理,避免影响业务运行,可快速恢复业务有序运行。
网路设备端口流量分析功能,能够帮助用户了解各个交换机的流量情况,在出现流量异常的时候及时发现。