监控
监控
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般...(more)
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般是通过告警管理、日志管理、信令跟踪、探针、诊断测试来实现对系统的监控。

热点

Prometheus·2021-11-05
airstuky · 某金融银行 擅长领域:数据库, 云计算, 服务器
10 会员关注
收藏3
评价5
金币1
银行监控·2021-10-28
北京不眠夜@博云 · 公司 擅长领域:云计算, 容器, 容器云
3 会员关注
现在常见的做法都是加入数据分析,形成AIOps方案,实现智能分析,进而压缩无效告警,提升告警质量。目前,AIOps方案和厂家有很多,但总体效果差强人意,但方向是没问题的,还需要时间积累。告警规则的优化,是经常被忽略的地方。通过,细化告警触发规则,不同业务不同资源提供更加匹配的告警规...
互联网服务监控·2021-09-08
hufeng719联盟成员 · 某钢铁企业 擅长领域:数据库, 存储, 服务器
145 会员关注
楼主能否共享下您的 prometheus 安装部署文档?跪求 我们也计划部署监控系统  但是自己不会搞
银行Kubernetes·2021-09-17
沈天真 · IPS 擅长领域:服务器, 云计算, 存储
13 会员关注
loki 官网上有多种安装方法 ?https://grafana.com/docs/loki/latest/installation/local/
系统集成监控·2021-09-17
北京不眠夜@博云 · 公司 擅长领域:云计算, 容器, 容器云
3 会员关注
IPMI,对硬件配置型号、状态都可以获取到。前提,需要把服务器管理口接入到网络中,俗称带外管理网。每个服务器厂家都有获取自家硬件信息的工具。HP的好像叫lio,时间太长不记得了。市场上有专门做带外管理的厂家和产品,可以了解一下。...
系统集成Zabbix·2021-09-22
conling联盟成员 · 医院 擅长领域:数据库监控, 监控, 数据库运维管理
1 会员关注
如果是使用采集器,可以从zabbix_sender返回异常如果是发送告警信息,需要人为测试脚本的有效性
系统集成Zabbix·2021-09-26
conling联盟成员 · 医院 擅长领域:数据库监控, 监控, 数据库运维管理
1 会员关注
1、服务器的配置提升,允许运行更多的监控进程,需要对应的修改conf文件,放开更多的监控进程;2、修改Agent的工作模式,从被动改为主动,降低Server的处理压力3、调整监控项的监控间隔,非关键项将监控间隔调整为分钟或者小时,降低监控压力针对100台主机,1+3 就可以解决你的问题。...
Zabbix·2021-08-20
liujiandong · rongsinfo 擅长领域:监控, 数据库监控, 系统运维
9 会员关注
SNMP概念:在前面我们主要讲到怎么监控服务器,用的是agent程序。但是如果想监控如打印机、交换机、路由器等设备,前面的方式是不可行的,因为在这些设备上安装完整的操作系统和Zabbixagent是不可能的。所以,这个时候我们需要借助snmp协议来获取网络设备的相关数据。SNMP是英文"S...(more)
浏览3188
银行容器云·2021-08-02
henrylv206 · 建信金融 擅长领域:云计算, 容器, 容器云
容器云平台相关安全方向:系统安全 镜像安全 运行时安全 平台安全 网络安全 监控方向:系统监控 平台监控 应用监控实现方案:prometheus

描述

众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般...(more)
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般是通过告警管理、日志管理、信令跟踪、探针、诊断测试来实现对系统的监控。
X社区推广
  • 提问题