作者:finedatalink
发布时间:2023.9.11
阅读次数:391 次浏览
数据库中存在两张表,其中数据来源表每天会更新、删除、新增。希望数据来源表数据变化后,「目标表」也随之更新,与数据来源表的数据保持一致。
例如:数据来源表「出入库信息」,昨天新增两条数,序号分别为 9 和 10,删除序号为 6 的数据,序号为 7 的数据「出库数量」变为 102 。
希望这些数据变化能更新到「目标表」中,如下图所示:
利用数据调度平台实现数据同步
目标表
FDLDemo 数据库中,有「目标表」。表信息如下图所示:
数据来源表
FRDemo 数据库中,有数据来源表「出入库信息」,昨天新增两条数据,删除序号为 6 的数据,序号为 7 的数据「出库数量」变为 102 。表信息如下图所示:
现在希望,目标表数据定时更新,与数据来源表保持一致。
1)新建一个 ETL 任务,将一个「数据同步」节点拖到设计界面,并对该节点进行设置。如下图所示:
通过对比目标表和数据来源表中的「序号」字段,将数据来源表中新增和更新的数据更新到目标表中。
如果存在来源表「出入库信息」中有但是「目标表」中没有的「序号」,则将这些数据更新至「目标表」,同时当遇到来源表和目标表的序号相同时,会将来源表「出入库信息」中的数据覆盖更新到目标表。
如下图所示:
本节步骤目的:通过「数据转换」节点中的「比对删除」算子,将来源表中删除的数据从目标表中剔除。
将一个「数据转换」节点拖到设计界面,并与「数据同步」节点相连。如下图所示:
点击「数据转换」节点进入设置页面,添加「DB表输入」算子。
查询出来源表「出入库信息」中的数据,如下图所示:
再添加一个「比对删除」算子,与「DB表输入」算子相连。
对于「对比删除」算子,通过设置对比字段为「序号」,进行数据对比,若「目标表」中存在来源表「出入库信息」中没有的序号,则会将「目标表」中的该条数据删除,然后点击右上角「确定」按钮,如下图所示:
1)点击「调度配置」,设置任务定时执行时间。让该任务每天在指定时间运行一次,如下图所示:
注:用户根据实际情况设置执行时间。
2)点击右上角「保存」按钮。
任务执行后,目标表数据如下图所示:
数据调度平台可以帮助提高数据管理质量和效率,在数字化时代下,大数据治理对企业数据建设的重要性不言而喻,然而实现的困难有时也让人望而却步,因此选择合适的技术和工具会达到事半功倍的效果。帆软FineDataLink——中国领先的低代码/高时效数据调度平台,能过为企业提供一站式的数据服务,通过快速连接、高时效融合多种数据,提供低代码Data API敏捷发布平台,帮助企业解决数据孤岛难题,有效提升企业数据价值。
数据集成平台产品更多介绍:www.finedatalink.com
上一篇: 实操演示:业务环节中数据仓库的调度怎么做下一篇: 多源异构数据源融合怎么做!一文解读