对于非结构化数据,IO模型多以顺序大IO为典型,往往要求存储系统可以提供高带宽,因此后端磁盘可以用大条带深度的的RAID5组成的pool,另外存储前端口充足,后端口一般我们无法控制,像高端存储后端磁盘会比较均衡的散列在后端板卡上,另外在整个IO path上,也就是服务器-san switch-存储系统不要有带宽短板,以规避木桶效应,现在主流的存储前端口可以配置16G,后端口也是12G了
对于TB级的数据进行实时检索,要看数据访问的特性,如果适用于分层存储,那是最好的性能和成本兼具的解决方案。
传统外置存储的scale out,产品差异性还是挺大的,如hp 3par的中端存储也可以进行四控的scale out,另外存储虚拟化的引入实际上也可以变相增强存储的扩展性,利用其在线的数据迁移功能,可以方便的在后端挂接存储上的数据重新分布