结构化数据,又是主要以大宽表方式使用,那基本列存数据库会有优势些。Hbase、 Cassandra这类数据库方案比较符合。但列存数据库想用好,就会有一大堆组件也需要顺带维护,有一部分隐性运管控成本在里面。 Hbase这类开源或者半开源商用方案,在效率上需要持久优化且优化的质量直接影响使用感受,但“专业做一行”的服务公司又比较少,所以很大部分的优化成本都需要内耗了。基本搞 Hbase这种开源方案做历史数据查分中心,又不想花钱的话,大概率“卷死”+“玩不出花活”的节奏。
需求内没有看到数据集市之类的场景,如果有的话,也可调研测试下MPP类的数据库。国产也有些拿GP做的换壳方案,有这方面需求的话,也可以调研交流下,至少有个托底……