博客
关于我
NIFI1.21.0_Mysql到Mysql增量CDC同步中_补充_插入时如果目标表中已存在该数据则自动改为更新数据_Postgresql_Hbase也适用---大数据之Nifi工作笔记0058
阅读量:794 次
发布时间:2023-02-15

本文共 772 字,大约阅读时间需要 2 分钟。

使用Nifi 1.21.0版本进行Mysql数据增量同步是一个复杂但重要的任务,特别是在处理日期类型和null数据时。以下是优化后的详细步骤和说明:


Nifi配置与Mysql增量同步流程

1. 读取Mysql Binlog事件

Nifi从Mysql的binlog中读取事件,以监控数据变更。binlog记录了所有对数据库进行的修改操作,包括插入、更新和删除。

2. 解析Binlog事件

解析binlog事件以提取有用的信息,如操作类型、表名、主键、旧值和新值。确保正确解析这些信息,以便后续处理。

3. 检查目标记录是否存在

在目标数据库中查找记录的主键或唯一标识符,判断目标记录是否已存在于目标表中。如果存在,则决定采用更新操作;否则,采用插入操作。

4. 数据处理与转换

  • 日期类型处理:确保日期值在转换时格式正确,避免转换错误。特别注意null值的处理,确保日期字段不被错误赋值。
  • null值处理:识别null值并根据业务逻辑进行适当处理,确保数据完整性。

5. 写入目标数据库

根据判断结果,决定是插入还是更新操作,将数据写入目标数据库,确保数据一致性和完整性。

6. 配置优化

  • 性能优化:调整Nifi的配置参数,如分摊处理、线程数和队列大小,以提高处理效率。
  • 错误处理:设置错误处理机制,确保异常情况下的数据处理不影响整体流程。

7. 测试与验证

测试整个流程,确保数据能够正确同步到目标数据库,检查是否存在重复插入或更新错误的情况。


注意事项

  • 数据一致性:确保在更新操作时,旧值和新值能够正确替换,避免数据冲突。
  • 性能调优:根据数据量和网络条件,合理调整Nifi的配置参数,确保流程高效运行。
  • 日志记录:详细记录日志信息,便于问题排查和优化流程。

通过以上步骤,可以实现高效且准确的Mysql数据增量同步,确保数据的一致性和完整性。

转载地址:http://yfjfk.baihongyu.com/

你可能感兴趣的文章
NIFI1.21.0_Mysql到Mysql增量CDC同步中_补充_插入时如果目标表中已存在该数据则自动改为更新数据_Postgresql_Hbase也适用---大数据之Nifi工作笔记0058
查看>>
NIFI1.21.0_Mysql到Mysql增量CDC同步中_补充_更新时如果目标表中不存在记录就改为插入数据_Postgresql_Hbase也适用---大数据之Nifi工作笔记0059
查看>>
NIFI1.21.0_NIFI和hadoop蹦了_200G集群磁盘又满了_Jps看不到进程了_Unable to write in /tmp. Aborting----大数据之Nifi工作笔记0052
查看>>
NIFI1.21.0_Postgresql和Mysql同时指定库_指定多表_全量同步到Mysql数据库以及Hbase数据库中---大数据之Nifi工作笔记0060
查看>>
NIFI1.21.0最新版本安装_连接phoenix_单机版_Https登录_什么都没改换了最新版本的NIFI可以连接了_气人_实现插入数据到Hbase_实际操作---大数据之Nifi工作笔记0050
查看>>
NIFI1.21.0最新版本安装_配置使用HTTP登录_默认是用HTTPS登录的_Https登录需要输入用户名密码_HTTP不需要---大数据之Nifi工作笔记0051
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_增删改数据分发及删除数据实时同步_通过分页解决变更记录过大问题_02----大数据之Nifi工作笔记0054
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_增加修改实时同步_使用JsonPath及自定义Python脚本_03---大数据之Nifi工作笔记0055
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_插入修改删除增量数据实时同步_通过分页解决变更记录过大问题_01----大数据之Nifi工作笔记0053
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表或全表增量同步_实现指定整库同步_或指定数据表同步配置_04---大数据之Nifi工作笔记0056
查看>>
NIFI1.23.2_最新版_性能优化通用_技巧积累_使用NIFI表达式过滤表_随时更新---大数据之Nifi工作笔记0063
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_根据binlog实现update数据实时同步_实际操作05---大数据之Nifi工作笔记0044
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_根据binlog实现数据实时delete同步_实际操作04---大数据之Nifi工作笔记0043
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置binlog_使用处理器抓取binlog数据_实际操作01---大数据之Nifi工作笔记0040
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_实现数据插入数据到目标数据库_实际操作03---大数据之Nifi工作笔记0042
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_生成插入Sql语句_实际操作02---大数据之Nifi工作笔记0041
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_03_来吧用NIFI实现_数据分页获取功能---大数据之Nifi工作笔记0038
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_不带分页处理_01_QueryDatabaseTable获取数据_原0036---大数据之Nifi工作笔记0064
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_无分页功能_02_转换数据_分割数据_提取JSON数据_替换拼接SQL_添加分页---大数据之Nifi工作笔记0037
查看>>
NIFI从Oracle11G同步数据到Mysql_亲测可用_解决数据重复_数据跟源表不一致的问题---大数据之Nifi工作笔记0065
查看>>