订阅

领域

内容分类

系统运维
系统运维类似于系统维护,前者更加侧重于保障系统正常运行,运维有运行和维护两层含义。对于一个系统,有时出错我们无法预知,系统越复杂,其维护难度越大,为了减少损失,我们尽可能地去预防各种错误,对于突发情况,尽可能地去修复。
系统运维类似于系统维护,前者更加侧重于保障系统正常运行,运维有运行和维护两层含义。对于一个系统,有时出错我们无法预知,系统越复杂,其维护难度越大,为了减少损失,我们尽可能地去预防各种错误,对于突发情况,尽可能地去修复。

热度排序时间排序
文章

Kubernetes·23小时前
观测云 · 观测云 擅长领域:云计算, 容器, 容器云
前言在Kubernetes环境中,事件(Events)是系统状态变化的重要指示器,它们记录了与集群中资源(如Pods、Deployments、Services等)相关的各种活动,如创建、更新、删除等。对Kubernetes事件的采集和分析,不仅有助于我们更好地理解集群的运行状态,还能为问题排查和性能优化提供有力的数...(more)
浏览71
大数据·4天前
腾讯蓝鲸智云 · 腾讯科技(深圳)有限公司 擅长领域:python, 自动化运维, 服务器
2 会员关注
主要用于配置主机属性的自动应用。当主机发生模块转移或模块新加入主机时,会根据目标模块配置的策略自动触发修改主机属性,比如主机负责人、主机状态。主机属性自动应用顾名思义是应用到主机上,而主机是必须在模块下的,所以有两种方式配置自动应用。一、按业务拓扑(模块)配置实...(more)
浏览171
Zabbix·4天前
乐维社区 · 广东乐维软件有限公司 擅长领域:监控, 系统运维, 数据库运维管理
28 会员关注
在企业生产过程中,并非所有的设备都需要全天候、满负载运转,也有些仅需要周期性的运转即可。例如,在某家企业,有一批这样的机器,每天都会在固定的时间跑批量任务,期间,机器的CPU使用率会有明显的提升。在这种情况下,如果zabbix触发器配置成为全天候生效机制,那么跑批量任务期间就C...(more)
浏览138
系统运维·2024-05-07
jason2006xu · 昆仑银行 擅长领域:系统运维, 监控, 云计算
45 会员关注
     一体化智能可观测平台探索与实践前言:随着新质生产力的发展以及数值化转型的纵深推进,商业银行在运维过程中建设了不少运维工具,比如基础监控平台、交易监控平台、APP端性能监控、后端APM、业务拨测等不同工具,数据比较分散,给运维人员分析问题、定位问题带来了不少...(more)
浏览362
自动化运维·2024-05-07
腾讯蓝鲸智云 · 腾讯科技(深圳)有限公司 擅长领域:python, 自动化运维, 服务器
2 会员关注
主机是配置平台管控最常见的资源,也是运维日常主要的管控对象;如何对主机进行全生命周期管理呢导入主机直接导入直接导入仅适用于直连区域(defaultarea)的主机,也就是网络跟蓝鲸平台能内网互通的。资源–>主机–>导入主机--690f8d5db44465553d3dfeccbf4ea038.png导入后...(more)
浏览378
DevOps·2024-05-06
Steven课题专家组 · steven 擅长领域:云计算, 容器, 容器云
77 会员关注
关于监控和可观测性的文章也很多了,不过有些内容有待商榷。比如网上有看到说可观测性是可靠性的一部分,这理解不太对。可观测性和可靠性是两个方面,系统可不可靠和具不具备可观测性没有必然联系。可观测性不是可靠性的一部分,不过系统可靠性可以通过可观测性来展现,比如说通过...(more)
浏览2269
自动化运维·2024-04-30
腾讯蓝鲸智云 · 腾讯科技(深圳)有限公司 擅长领域:python, 自动化运维, 服务器
2 会员关注
通过【运维自动化-配置平台】如何创建业务机拓扑(集群-模块)我们知道了直接创建集群和模块的操作方法,直接创建的方式适合各集群模块都相对独立的场景,那大量的、标准规范的集群模块如何快速创建呢,这里就引入了集群模板和服务模板。服务模板简单理解就是模块的模板,可以批量管...(more)
浏览294
自动化运维·2024-04-30
腾讯蓝鲸智云 · 腾讯科技(深圳)有限公司 擅长领域:python, 自动化运维, 服务器
2 会员关注
业务,是蓝鲸CD体系中比较重要的概念和维度,日常使用中主机、进程、业务拓扑的管理都需要依赖已经存在的业务,其他蓝鲸体系产品也基本上都是围绕业务的维度来提供对应的服务和相关的鉴权。1、创建业务/业务集请确保有创建业务的权限,一般可以由管理员创建或申请创建业务的权限...(more)
浏览329
日志分析·2024-04-24
观测云 · 观测云 擅长领域:云计算, 容器, 容器云
前言做为一名移动端开发者,深刻体会日志采集对工程师来说具有重要意义,遇到问题除了debug调试就是看日志了,通过看日志可以帮助我们了解应用程序运行状况、优化用户体验、保障数据安全依据,本文将介绍日志采集的重要性、移动端日志的采集方式,最后介绍下如何通过观测云对移动...(more)
浏览365
自动化运维·2024-04-16
byson · 平安科技(深圳)有限公司 擅长领域:系统运维, 安全, 自动化运维
自动化运维技术在现代信息技术领域中发挥着日益重要的作用,它可以帮助企业和组织提高效率、降低成本,并增强业务的稳定性和可靠性。然而,随着自动化运维的广泛应用,安全性和合规性成为关注的焦点。本文将探讨自动化运维中的安全挑战和合规要求,并提出相应的解决方案和最佳实践...(more)
浏览4874
评论3
  • 分类
  • 信息
  • 领域
  • X社区推广