你的问题其实包括了监控的三个层次磁盘问题:基础监控层次配置特征关联:事件关联层次其他手段:运维大数据分析层次最上的一层是基于自主学习和统计学分析的方法,来基于该磁盘问题,自动得出历史上哪些系统出现过同样的问题,都是怎么解决的,解决的办法和方案有哪些,该问题对哪些业务...
如果仅仅从硬件角度,如服务器可以通过HMC的SNMP TRAP、X86管理口通过IPMI进行事件的监控,和一些硬件监控指标的采集。像你说的网络状态,无非就是端口UP和DOWN,这个可以从操作系统层进行监控,也可以从网络交换机层进行监控。...
简单以图片形式分享下我们企业ITM基础监控的三层架构:逻辑架构:图片7.png图片6.png物理架构:图片8.png这张图中的基础监控还包括了大数据应用日志监控
先给大家提供一下我们的高可用架构方案,欢迎大家踊跃提出思路和观点:图片1.jpg高可用架构说明为每个监控代理提供高可用的ITM监控服务。每一个监控Agent将指向主从ITM Remote TEMS,当主的Remote TEMS故障时,Agent将自动连接至备的 Remote TEMS,数据采集以及监控服务将不受影响...
大致谈谈我的经验:虚拟化的监控点分物理机整体的监控和虚拟机的监控:整体物理机的监控:整体物理机的资源利用率(使用CPU、使用内存、分配内存、分配CPU、分配磁盘等),物理机I/O卡的使用情况(网卡流量、HBA卡流量等),物理机的告警事件(通过虚拟化平台获得),物理机的硬件信息(通过硬件管...