面对海量数据的时候,个人认为首先是要识别数据的备份价值。海量数据当中并不是所有的数据都有备份的价值。企业应该明确哪些数据需要备份,哪些数据可以不备份。
其次,需要识别备份数据的活动特性、备份策略、重要性等特点。一旦系统发生问题,有些数据需要及时恢复,有些数据可以慢慢恢复。有些数据变化在一定周期内变化量很少,有些数据变化量非常大,那么相应的比分频度及具体策略就会有所区别。
再次,考虑备份介质成本的问题。在备份数据进行充分统计和分析之后,根据备份需求的不同选择符合成本要求的存储设备,比如网络文件系统、分布式对象、带库、光碟库,甚至是云存储等。