日终跑批期间,如何能快速准确的监控到计算资源和io的峰值,以便后续调整?
首先,跟系统架构类似,监控也应有结构和层次,尤其在系统架构各个要素交接的地方。因为交接的地方最容易出问题和瓶颈。其次,监控的数据本身有时候并不能说明是否有问题,关键是数据必须要有参照标准,我们单位使用监控基线来作具体监控数据的参照标准,基线是较长一段周期中某一项监控数据的平均值或者中位数等等。只有基线做好了,监控的数据才能活起来,才能说明问题。
例如AIX系统可以通过nmon分析
这个事情可以这么看,
1 第一个层面,从批量系统的服务器层面来监控它的CPU、内存、IO等资源。
2 第二个层面,从数据库层面监控其数据库相关的指标(比如TPS、SQL执行效率,IO特点等)
3 第三个层面,可以从存储底层检测批量系统所用的存储卷读写指标,比如延时,比如IOPS,比如读写速度等。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30