数据同步的2种方式

数据集成/当前页

作者：finedatalink

发布时间：2023.9.26

阅读次数：986 次浏览

关于大数据量的同步

一般来说数据同步有两种方式：数据全量同步、数据增量同步

①数据全量同步：数据是先删后插入，但这样会造成数据短时间范围内的空缺，所以这样的方式在大数据量的情况下不是很可取

②数据增量同步：是通过主键对比的方式进行数据更新，这样就不存在数据空窗期的问题了

所以数据增量同步会更匹配题主目前的需求。

那可能有人会问，字段主键对比，假如是用SQL的方式怎么进行对比啊，数据量这么大....

那这时候就推荐通过时间戳的方式来进行增量对比更新，把上一次更新完的时间点保留下来，下一次通过这个字段的过滤，来进行数据同步。

且假如是用日志增量的实时同步技术，例如mysql的Binlog、Oracle的Logminer、sql Server的CDC等等，就不用担心要保存时间戳或者其他的配，因为一旦当数据库表字段有任何变化，在日志中都会被记录下来，直接对这部分的数据进行增、删、改即可！

数据实效性的问题，关系着我们具体用什么方法进行数据同步

假如是数据实效性不高，就可定时的方式来进行数据同步，那这时候数据源的获取可以通过SQL的方式，常用工具有开源的kettle等

但假如是对数据实效性有要求，需要实时数据同步，那基本方法是直接通过SQL Server的日志CDC模式进行实时同步，这样源库的变化，就能时刻同步到目标库，常用的工具有FineDataLink数据集成平台等

在数字化时代下，大数据治理对企业数据建设的重要性不言而喻，然而实现的困难有时也让人望而却步，因此选择合适的技术和工具会达到事半功倍的效果。帆软FineDataLink——中国领先的低代码/高时效数据集成产品，能过为企业提供一站式的数据服务，通过快速连接、高时效融合多种数据，提供低代码Data API敏捷发布平台，帮助企业解决数据孤岛难题，有效提升企业数据价值。