大数据平台的源数据格式一般用什么类型的哪?文本文件吗?那各个源系统的数据采集策略如何规划哪?例如实时性大概什么样子的哪?
一般适合用简单的格式,便于数据的拆解和组装,您说的文本是一种,还有比如json也是一种常见的方式。
源数据的采集是个大话题,一般的方式的本地采集,然后逐层汇总/筛选,再通过队列进行集中(相对的),这样的好处是:
实时性取决于网络和服务的性能,做的好的话保持在毫秒级也不是不可实现的
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30