数据中心的管理对象主要包括基础设施与IT基础架构两大部分。其中基础设施包括供配电、UPS、空调、消防、安保、环境监测等机房系统;基础架构包括网络设备、主机设备、存储设备等IT设备。
集中监控的目标就是要能够通过管理与技术的应用,对基础设施与IT基础架构的运行情况进行监视,实现故障与异常的实时发现与通知;此外还可以通过对监控数据搜集与整理,为容量管理、事件管理、问题管理、符合性管理提供分析的基础,最终实现数据中心高可用性的目标。 (2010-09-15)
监控管理对可用性管理的意义
所以说,集中监控管理就像是高可用性管理的一双眼睛,有了它整个数据中心的组件情况才能一目了然,高可用性的目标才具备实现的管理基础。

如何提升数据中心的可用性,已成为“高可用性IT服务”中的重要议题之一。作为保障数据中心可用性的第一道防线——“集中监控”可以快速帮助企业达成“高可用性”的目标。
根据ITIL的定义,所谓的“可用性”指的是:“一个配置项或IT服务根据需要履行协定职能的能力。可用性取决于可靠性、可维护性、可服务用性、性能和安全。可用性通常以百分比计算。这种计算通常基于协定服务时间和宕机时间”。高可用性IT管理是指:是指通过对IT架构及运维管理、基础设施及管理、灾备建设及运维、安全及管理等高可用性关键要素的改进与优化,提升IT系统的可用性,从而更好地保障业务持续运营和创新的过程。
在衡量可用性方面,具体又分为MTTR/MTBF/MTBSI等三个不同的指标(如下图)。从下图可见,无论是MTBSI还是MTTR,均有一个重要的组成部分——“Detect time(侦测时间)”。可见“能否通过有效的监控管理,及时、有效地发现数据中心中各管理对象的故障”,已构成数据中心高可用性一个充分条件。
▲