大型主机LinuxONE 单机 如何保证核心业务系统的可用性和可靠性?

       为了保证核心业务系统的可用性和可靠性,硬件层面一般会采用双机双冗余系统架构部署,数据库系统层面如ORACLE会以RAC集群方式部署。但对于大型主机LinuxONE,一般都会采用单机部署实现多核心系统运行(有成本因素存在),那么大型主机LinuxONE是如何实现系统层面的冗余、保证系统的可用性的?

参与12

5同行回答

wangbohaiwangbohai系统架构师IBM
你好, 感谢您积极参与,知道您是LinuxONE的使用者和你关心问题的背景。首先关于 “可靠性上,不知现在是否还存在CPU和虚拟网络互斥或干扰现象”。这个问题其实不应该属于可靠性,而应该属于CPU总体资源规划的范畴。虚拟网络,即HiperSockets通过系统总线传输数据,其过程需要消耗...显示全部

你好, 感谢您积极参与,知道您是LinuxONE的使用者和你关心问题的背景。

首先关于 “可靠性上,不知现在是否还存在CPU和虚拟网络互斥或干扰现象”。这个问题其实不应该属于可靠性,而应该属于CPU总体资源规划的范畴。虚拟网络,即HiperSockets通过系统总线传输数据,其过程需要消耗一些CPU资源。在正常CPU使用率的情况下,HiperSockets不会和其它负载竞争CPU资源(例如RAC)。据了解,首信的情况当时是做了一个压力测试,将RAC对CPU的消耗做到了将近100%,这种情况下出现了两者竞争。对于正常的生产情况,在合理的CPU规划下(90%以下),二者之间不会明显竞争。如果CPU资源确实紧张又不能很快扩充,则可以利用共享OSA卡来实现虚拟服务器之间的通讯,效果也很好。

第二个问题,“ 除了硬件服务维保方面,系统层面的运维服务有哪些?”。严格意义上的服务是需要收费购买的。IBM GTS和Lab Service都可以提供一些定制的服务,如果真有需求可以帮你们和他们洽谈。此外我们STG LinuxONE售前团队有一个zCare计划,由售前工程师定期访问已装机用户,帮他们查看系统健康状况,提供运维实践建议等等。但这种计划不会像购买的服务那样承诺人天等等。

收起
硬件生产 · 2016-02-24
浏览1723
wangbohaiwangbohai系统架构师IBM
大型主机专门为政府关键业务而设计, 从系统架构到芯片层面都全面地包括冗余和自动监测与恢复机制, 系统整体平均无故障时间大于40年,大部分部件维护都可以不停机进行,因而单机个便胜任关键业务的可用性要求。系统整体的可用性包括硬件、OS、中间件、和应用软件等等。Linu...显示全部

大型主机专门为政府关键业务而设计, 从系统架构到芯片层面都全面地包括冗余和自动监测与恢复机制, 系统整体平均无故障时间大于40年,大部分部件维护都可以不停机进行,因而单机个便胜任关键业务的可用性要求。

系统整体的可用性包括硬件、OS、中间件、和应用软件等等。LinuxONE已经提供了坚实的硬件可靠性和可用性。利用虚拟化技术,在一台LinuxONE中部署多个Linux虚机,部署Oracle RAC, 或WAS Cluster等等,可以实现等同于物理分布的多机环境。事实上在一台LinuxONE中部署虚拟集群比物理集群更可靠,因为LinuxONE内部的虚拟网络比外部物理网络更可靠和高效。

收起
硬件生产 · 2016-02-24
浏览1737
Linux2Linux2系统架构师IBM
LinuxONE内部的高速网络走的是内存,而不是物理网卡,所以本身会消耗一些CPU, LinuxONE承载的应用本身如果消耗CPU就已经超过95%以上时,我们可以考虑使用另一种高速内网方案,即Shared OSA方式,内部网络共享一个物理网口,IP包不用出网卡,在网卡内部直接交换数据,LinuxONE的每个OSA卡...显示全部

LinuxONE内部的高速网络走的是内存,而不是物理网卡,所以本身会消耗一些CPU, LinuxONE承载的应用本身如果消耗CPU就已经超过95%以上时,我们可以考虑使用另一种高速内网方案,即Shared OSA方式,内部网络共享一个物理网口,IP包不用出网卡,在网卡内部直接交换数据,LinuxONE的每个OSA卡都内置2个高速Power芯片,专门用于数据交互,实际测试中Shared OSA方式的内网效率和内存级的内网效率接近。

收起
硬件生产 · 2016-09-23
浏览1566
hunter202hunter202系统架构师capinfo
对于大型主机LinuxONE的硬件方面的可用性和可靠性毋庸置疑,但是如你所说,系统整体的可用性包括硬件、OS、中间件、和应用软件等等。对一套系统架构的设计,除了考虑硬件、更重要的是OS及OS之上的软件及应用,还有对存储层面的考虑了,单台设备硬件可能到达5个9 ,但加上OS及软件、...显示全部

对于大型主机LinuxONE的硬件方面的可用性和可靠性毋庸置疑,但是如你所说,系统整体的可用性包括硬件、OS、中间件、和应用软件等等。对一套系统架构的设计,除了考虑硬件、更重要的是OS及OS之上的软件及应用,还有对存储层面的考虑了,单台设备硬件可能到达5个9 ,但加上OS及软件、存储等,系统整体可用性和可靠性至少会降低一个级别。

对于目前在大型主机LinuxONE上利用虚拟化技术实现多个Linux虚机,从IBM多年的技术发展也是毋庸置疑,但 “因为LinuxONE内部的虚拟网络比外部物理网络更可靠和高效”这一点有点质疑,从带宽角度没问题,LinuxONE内部的虚拟网络至少40G之上,可靠性上,不知现在是否还存在CPU和虚拟网络互斥或干扰现象?

收起
IT其它 · 2016-02-24
浏览1634
hunter202hunter202系统架构师capinfo
问题补充:    从持续性发展角度讲,设备替换容易,管理和服务的有效连续难,运维管理和服务对于系统可靠稳定运行更为重要。对于像IBM 对于大型主机LinuxONE封闭式系统,除了硬件服务维保方面,系统层面的运维服务有哪些?...显示全部

问题补充:

    从持续性发展角度讲,设备替换容易,管理和服务的有效连续难,运维管理和服务对于系统可靠稳定运行更为重要。对于像IBM 对于大型主机LinuxONE封闭式系统,除了硬件服务维保方面,系统层面的运维服务有哪些?

收起
IT其它 · 2016-02-24
浏览1664

提问者

hunter202
系统架构师capinfo
擅长领域: 服务器数据大集中灾备

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2016-02-24
  • 关注会员:3 人
  • 问题浏览:6884
  • 最近回答:2016-09-23
  • X社区推广