山西证券总部火灾致客户端无法登陆 回应:不确保恢复时间
有一票人的职业将受到影响,从系统架构师来说,我们的启示是啥,大家是否可以探讨一下?
新闻源头:
这个事件很好的给大家提了个醒,灾难性的事件并不遥远,容灾也不应是应付领导、监管部门的摆设,而是实实在在关系到企业运营的关键要素。
不过在生产系统还有大量工作未完成的时候,又能有多大精力投入到灾备呢?灾备其实是各家的大难题,只不过是这次山西证券真的遇到了事,把问题全部豆暴露了,难道大家平时不也都有一丝侥幸心理么?所以,在出事后追责是必须得,但是反思更是必须得。到底灾备系统应该怎么建,是值得我们大家深深思考的问题。
我们一直徘徊在风险、成本、收益三者之间,灾备的成本是巨大的,但是其所带来的收益则是不可预知的,因为谁也不知道何时会发生灾难,也可能是因为灾难的几率实在太小,所以大家一直没有真正像建生产中心那样用心去建灾备中心,那我们能否像买保险一样把灾备外包出去呢?或许灾备中心的外包会是下一个风口。
像证券这个特殊行业实际上每年都是有条件去进行灾备演练的,像平时在周末或者节假日模拟演练都是可以的,比如在交易主机在灾备中心开启,报盘机生产中心开启,模拟进行交易都是可以的,不知道山西证券是如何做的?
我觉得像证券这样的行业,出现这样的错误,觉得问题很是严重,一是监管存在问题,两地三中心就是一个摆设吧,而且后面存储腐败也不可知;二是灾备信息系统建设存在严重问题,生产中心出现问题,灾备系统应该马上可以启用的,而且灾备中心的设备和配置环境应该和生产中心环境应该是一样的,如果灾备不可用是不是说明放在那就几个主机和存储,和报盘机就说一个冷冰冰的机器而已了,希望大家多发表讨论
银联、淘宝、京东、腾讯等大型金融服务公司都出现过。
原因非常多。对于灾备建设重视是一个重要方面。
但是最关键一面,还是对于运维人才和队伍建设和重视。
所有问题浓缩下来,都需要高质量高水平的队伍。
所以,大型企业,需要自建。中小型企业可专业运维外包。
收起露出的问题表明建立容灾是非常重要的,金融行业又非常特殊,日常的备份机制是必须的,同时容灾系统也需要经常进行日常的演练,发生这么大的事情,造成这么严重的影响,恢复时间都不能清楚告诉股民,日常管理和运维应该很不到位,需要加强平常的管理和运维、演练
收起