公司的数据仓库项目做重大迁移,db2彻底退服,上Oracle exadata,配置库变mysql(单机pcserver)。由于数据仓库项目的稳定性,公司开发决定放弃10年前的ETL工具,不再升级并支持新功能。
数据仓库的ETL工具主要实现的数据装载(支持多种关系型数据库,校验、清洗、文件压缩等)、数据抽取(支持多种关系型数据库)、数据传送(支持各种协议)。
因为以前都用的公司自己的etl工具,所以对其他产品都没什么了解,只很浅的应用过Kettle,从自己查找的资料上来看,etl工具的性能,易用性,稳定性差距还是很大的。都有哪些在数据仓库项目上应用的开源成熟ETL工具?我看很多都是基于java的,也有Ruby和Go的(不过好像都是在大数据上应用),py现在很流行,有py的吗?数据仓库和大数据项目现在都数据交换频繁,有ETL工具是兼容两者的吗?
请各位大佬指点。