数据同步策略概览
创始人
2024-11-15 17:38:23
0

数据同步在业务开发中比较普遍,例如 订阅MySQL的binlog将数据同步至异构数据库。数据同步方案需要考虑一下几点:

  • 数据实时性要求
  • 数据量级
  • 是否有数据转换逻辑

可分为两种模式

  • 发布订阅模式:分为订阅数据库log还是订阅应用层发的消息
  • 点对点模式:分为推和拉

以下讨论几种比较通用的方法:

  1. 日志订阅:订阅数据生产方库表日志,如mysql的binlog
  2. 双写:数据生产方应用层双写,直接写入数据消费方或写入mq
  3. 定时批量select:基于updateTime等字段定时批量推送/拉取数据

同时,数据同步会存在以下几个普遍问题:

  1. 延迟
  2. 写放大

日志订阅

订阅db的日志,如mysql的binlog,进行数据同步,其他的异构数据源均以db数据作为 source-of-truth。

该方法实现了应用层的解耦,但系统复杂度增加。

MySQL 主从同步

主从同步Chapter 19 Replication

同步进度跟踪方式分为:

  • binary log based replication
  • global transaction identifiers (GTIDs) based replication

同步ack策略分为:

  • one way (asynchronous) replication
  • semi-synchronous replication
  • delayed replication

同步数据格式:

  • Statement Based Replication (SBR)
  • Row Based Replication (RBR)
  • Mixed Based Replication (MBR)

主从同步同步数据格式一般为Row Based,同步ack策略根据从库读写要求,一般主库备库设为semi-sync方式,其他RO库、大数据抽数库设为one way sync。

日志订阅中间件

databus, flink cdc, canal

数据同步工具之FlinkCDC/Canal/Debezium对比

双写

在应用层执行数据落库之后可以进行数据同步操作,比如直接调数据接口、发mq消息。
该方法实现简单、灵活性高, 但数据不一致的风险增加,需要配合巡检任务等兜底校验来减小不一致对业务的影响。

消息订阅

rocketMQ kafka …

本地消息表

基于本地消息表确保业务数据落库和消息发送的原子性,开源组件可参考spring-tx-message

Spring Event扩展点

基于Spring Event实现双写

参考:SpringEvent扩展性利器

MyBatis 拦截器

基于 MyBatis Interceptor实现双写

参考:Mybatis plugins

定时批量select

数据消费方可以定时拉取数据生产方的数据,批量导入消费方的本地库。

该方法同样可以自定义条件拉取数据并做逻辑转换,相当于定时ETL。

定时任务

Xxl-Job ElasticJob

任务执行需要保证幂等

批量

Spring Batch

同步延迟

同步延迟无法避免,在使用同步时需要考虑场景,强一致要求的场景还是得读数据源头。

此外,可以通过一些妥协避免延迟带来的业务影响,比如:前端调写库接口,写库后需要将数据同步到ES,ES本身也是准实时的(写入后1s内能查到),如果前端写完返回成功直接读后台接口,后台接口在ES查不到数据,就很奇怪。这时可以在前端写完后转圈圈1~2s,用户体验不会差,同时极大程度减小同步延迟带来的影响。

写放大

微批处理,根据业务主键只写最新数据

相关内容

热门资讯

终于来了,Runway gen... 最近有好几个学员私信我们,让我出一期Runway完整的使用教程,刚好11月Runway对外发布运动涂...
人工智能搜索引擎 Perple... Perplexity AI是一款革命性的人工智能搜索引擎,结合传统搜索索引与大型语言模...
k8s核心知识总结 写在前面时间一下子到了7月份尾;整个7月份都乱糟糟的,不管怎么样...
C# 组合Cancellati... 前言在异步编程中,经常需要使用CancellationToken来取消任务的执行。 但...
【PyTorch】多对象分割项...  【PyTorch】单对象分割项目对象分割任务的目标是找到图像中目标对象的边界。实际应用例如自动驾驶...
【服务器】解决ssh登录问题k... 服务器上容器被退出 docker ps -a //查看使用情况 //如果显示为Exitedÿ...
“postman请求JSON格... 问题描述:传递数据一切正常,但是:原因剖析:...
射频工程师主要是干什么? 在硬件从业者中,有一部分从业者是专门负责射频,天线,基站信...
m3u8转MP4(网页视频下载... 准备工作什么是m3u8文件        记事本打开m3u8文件: #EXTM3U #...
angular入门基础教程(十... 前后端分离开发,少不了与后端进行数据接口的对接,在vue,...