想找到一款适合中小银行使用的应用级别的自动化运维产品 主要实现自动巡检 系统信息采集 新系统上线前合规性检查 程序自动部署 生产系统与灾备系统间应用版本比对等功能
现在可以使用的工具很多,最常用的就是puppet和ansible,在一些银行中都有相关案例。
puppet比较适合做状态保持类的工作,建行用的就是puppet
ansible适合做一次性批量工作
但是,我有一些建议:
1. 银行中的“批量”工作实际上并没有那么多,这个是受限于银行的变更流程,所以
2. puppet+mco也可以实现批量的命令执行,但是,在进行批量命令执行的时候,要注意黑白名单的问题,避免误操作导致大批系统的故障,目前这些工具还不怎么提供黑白名单的功能,这个需要自行开发
我在客户现场使用的foreman+puppet+mcollective,然后自己按照客户需求做了定制的界面和定制的功能,包括一些基于安全的风险防范。
收起主机信息管理应该可以搞定你说的设备信息和软件版本问题。
巡检也可以
这2个都在我之前项目中都是用puppet的fact机制来实现的,很多工具都有类似的机制。
应用的巡检,这个比较麻烦,因为就像自动化生产线一样,产量太低的时候,生产线的投入都收不回来,今天早上看书,说集装箱刚刚使用的时候,做集装箱运输的公司赔得一塌糊涂,连集装箱之父公司都抗不下去黄掉了。
自动化运维也是一样的,这就是我们所说的“纳管”问题,进行纳管的对象,必须数量足够多。
前段时间,跟一个朋友讨论一个mongo集群的puppet实现,后来才发现只有一个集群,4个节点,我说:大哥,你写个脚本装吧,别放到puppet里了....
不过,哪位大哥说,老子有的是钱,你干不干? 你们猜什么结果?
我屈服了!
收起多数据中心应用对比不是重点 比较侧重上文中的1、2和4 其中自动巡检、设备信息和软件版本比较重要 不知道您提到的puppet产品是否适合这类运维管理需求 主要前期想解决应用层面的人工巡检和大量设备的软硬件版本维护工作。
就应用层面的巡检我想问一下 该产品是怎么解决不同应用系统的个性化需求 因为应用层面的巡检不像操作系统那样有规可循 可能千人千面 不同的应用系统巡检方法也不一样 难道需要逐个去定制巡检脚本?这个问题是怎么解决的 谢谢
收起puppet足矣
“多数据中心间的应用程序版本比对”,这个用自动化工具原生实现不太好做,我脑子里还么有特别成熟的方案,因为这个“对比”,要去构建对比关系,这是一个额外的信息,维护起来可能会比较麻烦。
收起