作者:finedatalink
发布时间:2023.9.6
阅读次数:334 次浏览
1.确认需要同步的数据表,后期需要持续改动的表、迁移前后数据库中都存在该功能的表
2.确认异构数据库之间表和字段的对应关系
目前异构数据库的同步方式主要有以下几种:
1.触发器
在源数据库建立增、删、改触发器,然后根据变化登记表进行处理。优点是充分结合业务进行处理,保持数据的一致性、完整性,实时性较强,对多个数据源合并有非常大的优势。
2.日志
通过分析源数据库日志,来获得源数据库中的变化的数据。基于日志的采集方式无需在源库端部署任务代理程序(Agent)及建任何表,对源数据库无侵入和影响压力。ORCLE 的 异步 CDC (Asynchronized CDC) 就是使用这种方式,但缺点是有一定延时。
3.时间戳
同步过程通过特定属性(如时间戳、自增序列)来识别新插入的数据,该方式实现最简单,但无法记录删除和更新,也不具备实时的能力。
4.快照
快照可以表示数据的一个副本或者复制本,所以可以当作数据源,通过比较源表和快照表获得数据变化,但需要消耗大量存储空间和计算资源。
1.kettle
kettle是一款免费的国外开源ETL工具,表输入接收的数据全量放入服务器内存内,在内存中完成各类数据转换,比如跨库关联、新增列等计算,数据转换后得到的结果通过表输出组件,传入目标数据库,一般使用没什么问题,但如果你的数据量比较大,那么kettle内存计算的性能瓶颈明显,面对大数据量抽取时,kettle的性能表现并不好。且kettle只支持定时批量的数据同步,如果对数据实时性有一定需求,可能就要看看别的工具了。
2.DataX
DataX 是阿里开源的一个异构数据源离线同步工具,提供稳定高效的数据同步功能,DataX作为一个服务于大数据的ETL工具,除了提供数据快照搬迁功能之外,还提供了丰富数据转换的功能,但DataX是以脚本的方式执行任务的,需要完全吃透源码才可以调用,学习成本高,没有图形开发化界面和监控界面,运维成本相对高。
3.Oracle GoldenGate
Oracle GoldenGate软件是一种基于日志的结构化数据复制软件,实现原理是通过抽取源端的redo log或者 archive log,然后通过TCP/IP投递到目标端,最后解析还原应用到目标端,使目标端实现同源端数据同步。和DataX存在类似的使用难点,没有图形化的界面,操作皆为命令行方式,可配置能力差。
4.FineDataLink
FineDataLink是国内数据同步这块做得比较好的工具,FineDataLink赋予用户仅通过单一平台,即可实现实时数据传输、数据调度、数据治理等各类复杂组合场景的能力,提供数据汇聚、研发、治理等功能。和上面说的工具相比,FDL拥有低代码优势,通过简单的拖拽交互就能实现数据同步全流程。
其原理是通过LogMiner、binlog、CDC等日志解析的方式进行实时同步,减轻数据同步对源库带来的数据压力,基于异构映射实现异构数据实时同步融合,支持对变化数据(DML)和库表结构变化(DDL)进行同步,降低异构数据融合成本。
FineDataLink是一款低代码/高时效的数据集成平台,它不仅提供了数据清理和数据分析的功能,还能够将清理后的数据快速应用到其他应用程序中。FineDataLink的功能非常强大,可以轻松地连接多种数据源,包括数据库、文件、云存储等,而且支持大数据量。此外,FineDataLink还支持高级数据处理功能,例如数据转换、数据过滤、数据重构、数据集合等。使用FineDataLink可以显著提高团队协作效率,减少数据连接和输出的繁琐步骤,使整个数据处理流程更加高效和便捷。
数据集成平台产品更多介绍:www.finedatalink.com
上一篇: 数据融合是否只能融合格式相同的数据?下一篇: 异构数据库实时同步工具有哪些?