集中式存储比分布式存储更稳定,且价格越来越便宜,对于中小城商行而言,数据量和增量远不如大行,集中式存储的容量已能满足数据存储容量的要求,在此情形下,是否还有必要引入分布式存储,如要引入,除了大数据平台外,还适合用在哪些场景?容器云平台如果采用分布式存储对城商行来说运维压力和风险是否能很好控制?
主要根据银行自身的需求和实际的应用规模来选择,对于城商行而言,如果集中存储存储的容量和性能等都能够满足需求,还需要考虑管理和维护等, 毕竟引入分布式存储,新引入的技术栈势必增加管理维护的工作量。
收起对存储的扩展主要还是要根据现有业务和将来可能发生的业务,按描述来看。如果目前集中存储能够满足数据存储的要求,重点:并且在未来几年之后能够满足业务的增长,那么则不是必须要引入分布式存储,毕竟银行的业务首要的是稳定和高io运算,分布式存储更多的应用场景倾向于非结构化的业务,虚拟化,或者影像,文件。即使引入分布式,也应该是侧重在虚拟化业务层,或者是银行的双录存档方面,传统的业务数据库可以保留在集中式存储上。当然。一切的规划还是要看实际银行现有业务,未来扩展需求,资金投入和技术储备。
收起从一些实践经验来看,如果规模不大,优先考虑集中式存储,维护简单,运维成本低。当形成超大规模以后,会促生分布式存储需求,因为其更加灵活和动态,但是会带来很大的技术学习成本,故在短期内不建议实施,呈现一定规模后可考虑。
收起分布式存储其主要的优势就在于其扩展性和并发处理能力的考虑,其不足就在于其并发控制机制对于数据的一致性要求上略低。所以,分布式选型上要充分考虑这两点。
另外,如果单从数据存量上来考虑问题,可能略显不足。因为业务和应用是在不断发展的,如果能判断某一个业务或应用的未来发展趋势,那么我们的判断是理智的,如果不能,那就需要用发展的眼光去看。
集中式存储和分布式存储并不是一个对立,使用集中式存储的同时也可以采用分布式存储,使用场景根据实际业务需求而决定。
虽然集中式存储的控制器性能已经足够强大,但是受限于当前存储介质和存储技术的缓慢增速,集中式存储的横向性能扩展相对比较繁琐,但其稳定性和可靠性上限特别高,适合金融核心业务的支撑。
分布式存储强势之处在于扩展灵活,增加节点就可以在线动态扩展,相对于集中式存储,分布式在同一价格层级实现的性能与容量的设计比中低端集中式存储要高不少,并发性能可玩性高,因此这也是吸引企业尝试分布式存储的一个重大关键。
当然,集中式存储通常为专业架构加上定制化,稳定性和可靠性以及性能的平衡已经达到极致。分布式存储多是以服务器来搭建,服务器本身的制造标准比存储就低不少,加上还有分布式软件,因而在稳定性和可靠性以及性能三者平衡取舍上不如集中式存储。这也是分布式存储带来的主要运维压力。
至于分布式的场景,现在比较主流的业务场景比如BI经营分析,BD大数据,影像等,也都比较多,是否采用取决于企业对这些业务场景的需求迫切度。不少企业也尝试为虚拟化,容器等配置分布式存储作为创新,在这两处场景分布式存储和中端存储旗鼓相当,甚至分布式存储的性能和成本优势会更加突出一点。
收起1, 分布式存储与企业存储的差异,可见附件 PPT
2, 企业存储长期稳定的演进着,三条主线勾勒着企业存储的发展,应用、平台、介质 & 协议 & 网络
a) 新兴的协议,如 NoF ;新兴的网络, RDMA ;新兴的介质, SCM , QLC 等;都在企业存储领域优先落地, OceanStor Dorado 已经支持了 NoF + RDMA + SCM ,并在考虑 QLC 的引入
b) 新兴的应用,如互联网金融核心, MySQL , Redis , TOMCAT , ES , Kafka 等等,并催生了新的平台 - 容器平台;而经过不断实践,企业 NAS 是最适合容器平台的存储底座
3, 同时,随着企业存储和 SDS 存储的合理竞争,企业存储的内部软件架构也在不断面向大规模场景改造,如今的企业存储内部大量采用了 DHT 打散等分布式软件技术
4, 自动化的本身,取决于对于外置管理平台的支持,企业存储从诞生开始,积累了大量的丰富的管理 API ,支持各种生态平台的对接能力,完全支持各种自动化平台的调用和编排
附件:
企业存储 vs. 分布式存储 .pdf (1.65 MB)
收起建议根据公司IT业务场景去选择, 通常分布式存储应用在应用服务器、中间件服务器等对IO没有极致要求和高可用方面有较高要求的分区上,结合应用、中间件和系统层面自身的双活及高可用设计,基本可以满足需求。
收起