作者:finedatalink
发布时间:2023.7.7
阅读次数:805 次浏览
在信息化建设中,企业仍会面临业务急、IT忙的情况。究其根源,有初期系统建设规范、数据实时同步技术限制、只能有部分支持数据实时同步等问题。
面对数据延迟T+1,我认为如果想做到数据的高时效,就要做到以下两点:
1. 数据的增量获取。
2. 强大的计算能力。
接下来主要介绍数据的实时增量获取。
企业常用的ETL模式是数据增量同步ETL和数据全量同步ETL。数据增量同步ETL每次只处理增、删、改的变化数据,减少大量非变化数据同步。与数据全量同步ETL相比,数据增量同步ETL可以用最少的资源提高数据同步效率。
那么如何具备增量的条件?一般的增量获取方法如下:
1. 时间戳:最常见的方式。但是在业务系统里,不是每张表都有时间戳。
2. 触发器:可靠性较高。但是对业务系统数据库性能损耗较大。
3. 全量对比得出增量数据更新:对源数据库的性能损耗较小。但是大数据量对比更新时,对工具的性能开销需求较大。
4. 全量对比MD5方式:建立一个结构类似的MD5临时表,通过MD5校验码比对。
5. 日志解析:常见的数据库具备日志归档等功能,从日志获取变化数据,通过代码来开发和管理。
如何选择增量获取方法?
· 如果想对业务系统改造最少,那么就不能使用时间戳和触发器的方式。
· 如果想提高数据同步效率,那么就不能使用全量对比获取增量的方式。
综上,推荐使用日志解析的方式。
帆软推出的数据集成工具FineDataLink的数据管道,通过MySQL binlog、Oracle LogMiner、和SQL Sever的CDC等日志解析,来实现数据的增量获取。
帆软FDL的数据管道采用流式引擎,实时捕获源数据库的变化,在毫秒内更新到目标数据库,实现数据实时同步。
FineDataLink是一款中国领先的低代码/高时效数据集成工具,能够为企业提供一站式的数据服务,通过快速连接、高时效融合多种数据,提供低代码Data API敏捷发布平台,帮助企业解决数据孤岛难题,有效提升企业数据价值。
数据集成平台产品更多介绍:www.finedatalink.com
上一篇: 想要实现实时数据同步?五步教你玩转实时数据管道下一篇: 如何进行API对接?进来看看!