得物自建DTS平台的技术演进

2023-07-09 15:07:41来源：得物技术

前言

DTS是数据传输平台(Data Transfer Platform的缩写)

随着得物App的用户流量增长，业务选择的数据库越来越多样化，异构数据源之间的数据同步需求也逐渐增多。为了控制成本并更好地支持业务发展，我们决定自建DTS平台。本文主要从技术选型、能力支持与演化的角度出发，分享了在DTS平台升级过程中获得的经验，并提供一些参考。

【资料图】

1技术选型

DTS的主要目标是支持不同类型的数据源之间的数据交互，包括关系型数据库（RDBMS）、NoSQL数据库、OLAP等，同时整合了数据库配置管理、数据订阅、数据同步、数据迁移、DRC双活数据同步支持、数据巡检、监控报警、统一权限等多个模块，以构建安全、可扩展、高可用的数据架构平台。

1.1 能力对比

图片

1.2DTS 1.0 - 以 canal/otter/datax 作为执行引擎

图片

1.3 为什么要切换到Flink?

为了支持多种读端数据源和写端数据源，需要一个统一数据处理框架，以减少重复组件和提高开发效率。同时数据源类型和组件的维护难度与复杂度呈线性增长，现有的组件需要统一维护到一个项目中。

Canal和Otter等组件的社区活跃度低，很长时间没有得到维护更新。因此，需要选择一个新的、活跃的框架。此外，现有组件也无法有效支持全量+增量一体化的操作。

因此，使用一个统一的数据处理框架，能够同时支持多种读端数据源和写端数据源，以及全量+增量一体化的功能，是必要的。这样能够降低组件的维护难度和复杂度，提高开发效率。

通过DTS 2.0，我们希望将canal/otter/datax演化为一个任务执行框架+管理平台，能够为后续大量数据源迭代提速。

1.4 DTS 2.0 以Flink作为执行引擎

现有的开发流程：

统一的任务执行框架，集成flink并引入connectors根据配置组装出具体的DTS任务维护并研发新的 connector

当我们需要支持新的数据源, 首先将数据源相关插件维护在connector中，接着在执行框架中引入需要的组件，其中存在大量的可复用的功能，这样就做到了connector及功能组件复用的效果。

2DTS 现有能力

图片

3我们做了什么？3.1DTS Connectors框架 - 数据源支持提速

在Flink CDC基础上实现的全量/增量任务同步框架，基本的架构如下

图片

其中Connector中分别实现了Flink提供的SourceFunction和SinkFunction函数，分别负责从读端读取数据，往写端写入数据，因此一个Connector可同时存在于上游或者下游。

任务的启动流程：指定任务Json配置, 根据类型加载SourceFunction和SinkFunction构建通用能力函数并启动

a. 任务的Main函数如下所示, 根据如下的Json文件加载到对应的Connector中的SourceFactory或者SinkFactory来构造对应的DataStream。

DataStream是Flink中提供的数据流操作类

public class Main {    public static void main(String[] args) throws Exception {        // 解析参数        ParameterTool parameterTool = ParameterTool.fromArgs(args);        String[] parsedArgs = parseArgs(parameterTool);        Options options = new OptionParser(parsedArgs).getOptions();        options.setJobName(options.getJobName());        // 执行任务        StreamExecutionEnvironment environment =                EnvFactory.createStreamExecutionEnvironment(options);        exeJob(environment, options);    }

任务Json配置:

{  "job":{    "content":{      "reader":{        "name":"binlogreader",        "parameter":{          "accessKey":"",          "binlogOssApiUrl":"",          "delayBetweenRestartAttempts":2000,          "fetchSize":1,          "instanceId":"",          "rdsPlatform":"",          "restartAttempts":5,          "secretKey":"",          "serverTimezone":"",          "splitSize":1024,          "startupMode":"LATEST_OFFSET"        }      },      "writer":{        "name":"jdbcwriter",        "parameter":{          "batchSize":10000,          "concurrentWrite":true,          ],          "dryRun":false,          "dumpCommitData":false,          "errorRecord":0,          "flushIntervalMills":30000,          "poolSize":10,          "retries":3,          "smallBatchSize":200        }      }    },  }}

b. 我们提供了两个抽象工厂类，SourceFactory, SinkFactory, 其中的createSource, createSink便是子工厂需要实现的方法，不同的数据源实现不同。

public abstract class SourceFactory {    public abstract DataStream createSource();}public abstract class SinkFactory {    public abstract void createSink(DataStream rowData) throws Exception;}

c.接下来，我们只需要实现对应的子工厂方法就可以了

public class BinlogSourceFactory extends AbstractJdbcSourceFactory {    @Override    public DataStream createSource() {        List tables = this.binlogSourceConf.getConnection().getTable();        Set databaseList = new HashSet<>(2);        // 使用对应的Connector构建DataStream    }}

d.通用能力函数：RateLimitFunction, BinlogPositionFunction 其中分别实现了对应的任务能力，例如限流，任务位点保存等。

public class RateLimiterMapFunction extends RichMapFunction {    private transient FlinkConnectorRateLimiter rateLimiter;    @Override    public T map(T value) throws Exception {        if (rateLimiterEnabled) {            rateLimiter.acquire(1);        }        return value;    }

当任务所需的函数都创建完成后，任务就真正开始运行了。

收益：

使用一套封装完善且易扩展的框架能够提高开发效率并降低后续代码的维护成本。相比于DTS1.0、Canal和Otter等项目，该项目的维护成本大大降低，同时提供了更好的扩展性，使得我们能够在短期内支持PostgreSQL、MongoDB、Hbase、StarRocks等不同的数据源。3.2RDS日志获取

DTS通过提供增量和全量同步能力为业务提供数据同步功能，但在增量订阅/同步任务执行过程中，可能会遇到一些异常情况。其中，以下三种情况需要特别处理：

Binlog可用性

云厂商的数据库实例本地binlog有效期8小时，过期部分进行OSS备份。MySQL业务高峰期或者DDL变产生大量的binlog, DTS任务尝试获取过期数据失败，任务因此中断。因此，DTS支持了本地binlog+OSS备份binlog的获取及切换，保障日志可用性。

数据库实例主从切换

RDS经常会发生主备节点切换，在切换的过程中要保证数据不丢。由于切换前后两个数据库实例 Binlog 文件一般都是不一致的，此时任务位点记录方式是 BinlogPosition 模式，则在切换之后任务需要自动进行 Binlog 对齐操作，进而保证数据的完整性。将新数据实例上的位点查询时间戳提前1-2分钟即可。

读实例订阅支持

DTS任务binlog dump连接数过多造成主库压力及影响DDL变更，因此需要支持读库订阅。云厂商的读库不提供备份，在读库日志过期时需要切换到主库进行读取。

3.3 全量增量一体化功能

图片

全量增量一体化是指先同步存量数据，待存量结束之后再开始同步增量数据。其中也加入了增量阶段的OSS备份日志获取。但存量阶段依然存在一些问题，需要进一步改造优化。

全量模式下新增表先进行存量数据同步再进行增量数据同步，该任务中已存在的表会因此导致数据延迟。待新增表数据同步完成，任务延迟则会恢复正常。

3.4 数据源接入- starrocks, postgres等

支持从mysql同步到starrocks和postgres, 在任务执行框架的基础上，只需要开发starrocks-connector, postgres connector支持对应的数据源即可。其中的其他能力，像多表同步、分库分表等场景都可以达到复用的效果。

3.5 JBDC写入改造

脚本扩展和动态表名路由：

图片

数据合并和多线程写入：

图片

3.6 监控告警

DTS任务需要采集flink任务指标，主要包括任务延迟、各个算子阶段的写入速率，算子被压及使用率等。其中任务延迟需要接入告警服务，于是我们选择了引入redis来缓存任务的延迟时间，再上报到告警服务来完成飞书的消息和电话告警。

4最佳实践4.1 0000-00-00 00:00:00时间戳的问题

MySQL的时间戳允许为0000-00-00 00:00:00, 在Flink任务中通常会被转换为null, 导致写入下游数据源失败, 因此需要做特殊标记对于不同的数据源做不同的转化保证写入的正切行。

4.2 FlinkCDC任务serverId唯一性

Flink CDC source 会伪装成 MySQL slave节点，为了保证数据的准确性，每个slave必须拥有唯一的serverId来标记该slave的唯一性。因此在flink cdc的任务中我们为每一个任务分配了一个唯一的serverId区间(范围区间是为了支持多并行度)。

4.3 Flink任务数据序列化瓶颈

在flink任务中使用DataStreamAPI并使用比较复杂的数据结构进行传输时，算子之间的序列化成本较高，两个方向，一是建立更为高效的数据结构进行传输，二是开启flink对象复用，并尽可能减少不同并行度之间的数据传输。

5未来演进

DTS作为一个数据同步平台主要功能是尽可能提供高效的数据源同步功能，助力于多变的业务场景。

5.1 基于Flink SQL的ETL任务管理

流式数据处理除了现有的DataStream API还存在SQL的形式，SQL作为一种通用的语言，对于数据相关的业务同学极大的降低了学习成本。而通过Flink SQL可以做到的ETL流式数据加工也能解决一些复杂业务场景的处理逻辑，将业务逻辑转化为DAG的流式处理图，通过拖拽的方式也能方便使用，FLINK SQL的演进方向能够和现有的Flink DataStream API互补。

应用场景：ETL强大的流式数据转换处理能力大幅提升数据集成效率，也能建实时报表体系，提高分析效率，同时也可以应用于一些实时大屏的场景。

5.2 统一技术栈

将现有的DTS能力都迁移到Flink平台上，保持统一的技术栈，能够极大的降低维护成本。现有遗留的双向同步、数据比对等能力需要做进一步的改造和迁移，符合整体技术收敛的趋势。

6总结

本文主要分享了以下几个方面：Flink相比现有的技术栈带来的收益，切换到Flink以后的迭代方向及架构功能上的变更、带来新的问题如何解决，以及未来的一些迭代方向，希望能让大家有所收获。

标签：

相关新闻

济南又现UFO？6天内3次拍到，“非常罕见” 2023-09-09
美观的明线装修效果图_美观的明线装修图片 2023-09-09
化工板块回暖多种化工产品“涨声一片” 2023-09-09
做蛋糕最关键的步骤是什么（做蛋糕的步骤是什么） 2023-09-09
东京奥运会有直播吗(中国女篮东京奥运会比赛直播) 2023-09-09
风里雨里后面怎么说（风里雨里下一句的对联） 2023-09-09
瓷砖磨花了可以用什么修复（瓷砖上面有划痕用什么办法可以去掉） 2023-09-08
愿以此功德平等施一切下两句是什么（愿以此功德） 2023-09-08
大熊猫为啥要吃草？听专家来科普 2023-09-08
养老年金险有必要买吗? 2023-09-08
香港特区政府医院管理局：普通科及专科门诊等暂停服务 2023-09-08
测控专业考研大学排名？ 2023-09-08
Web3新品牌ZAN亮相外滩大会为海外客户提供全栈安全可信技术 2023-09-08
爱丽家居：上半年全面完成美国工厂落地，预计产能6亿元左右 2023-09-08
今年以来河北百余个投资百亿元以上重大项目签约落地 2023-09-08
暴雨来袭，第一时间不要顾着发朋友圈！这份避险指南请收好 2023-09-08
厚朴树的价值（厚朴树的木材好不好） 2023-09-01
侨源股份股东户数连续4期下降累计降幅27.67% 2023-09-01
时间过得真快！博士乘组太空出差3个月了 2023-09-01
荥经旭昶食品有限公司(关于荥经旭昶食品有限公司简述) 2023-09-01
再次启程！知名浙商周成建带着美特斯邦威新项目回到家乡 2023-09-01
瑞银：2024年全面整合瑞信业务 2023-08-31
辽宁中科拟在公司产区内建设新厂房车间及其配套设施该项目建设总投资预计不超过1000万 2023-08-31
此选项卡已经恢复 ie8（此选项卡已恢复） 2023-08-31
“苏纳克希望抓住这个来之不易的机会” 2023-08-31
成都公摊面积改造 2023-08-31
8月31日超讯通信涨停分析：智能制造，5G，智慧物流概念热股 2023-08-31
澳大利亚军演再出事故：一军车翻车致6人受伤此前美军机坠毁致3死 2023-08-31
经纬纺机(000666.SZ)：预计无法在法定期限内披露2023年半年报 2023-08-31
全面保障义务教育优质均衡发展构建优质均衡基本公共教育服务体系 2023-08-31
在“坏消息就是好消息”的世界里：美股美债继续携手反弹！ 2023-08-31
安能物流上半年营收45.5亿元，同比增长9.9% 2023-08-31
碧桂园：上半年销售回款1185亿元，12个月内到期债务1087亿元 2023-08-31
新学期青岛多所学校集中“换帅”，涉及市南市北李沧和崂山四区多所热点中小学 2023-08-31
游客边走边买商家纷纷入局，城市漫步“走”出消费新时尚 2023-08-31
孙英仁造像记(关于孙英仁造像记简述) 2023-08-30
新奥股份: 新奥股份关于境外全资子公司完成部分美元债券回购的自愿性公告 2023-08-30
海天味业上半年营收降4.19%净利降8.76% 股价微跌 2023-08-30
新华保险发半年报股价跌1.98% 垫底保险板块 2023-08-30
摩比发展(00947)8月30日回购6000股 2023-08-30
浐灞生态区75亩商住用地挂牌出让，宗地要求建设绿色建筑和公建配套设施 2023-08-30
乌媒：基辅遭俄方袭击已致2人死亡 2023-08-30
河南鲁山县回应“715万建雕塑”：县住建局局长被免职，对造价等问题全面审查 2023-08-30
创业板指涨逾1% 上涨个股近3600只 2023-08-30
弘业期货：锰硅不具备长期上涨动力，盘面关注上方压力位6900元/吨 2023-08-30
中金公司：PEM制氢技术的渗透率将呈现上升趋势 2023-08-30
莫莉·杰普森(关于莫莉·杰普森简述) 2023-08-30
加长林肯车多少钱一辆（加长林肯车多少钱一辆） 2023-08-30
小S俩女儿演绎顶级时尚大片，一黑一白各有特色，姐姐更有高级脸 2023-08-30
河北省南皮县法学会举行首席法律咨询专家聘任仪式 2023-08-29
揭秘涨停 | 特斯拉机器人引爆概念股龙头封单超百万手 2023-08-29
井松智能：拟1000万元至2000万元回购股份 2023-08-29
软件ETF（515230）涨超4.1%，京北方涨停 2023-08-29
东莞证券给予泸州老窖买入评级，2023年半年度业绩点评：Q2营收高增，弹性延续 2023-08-29
辛巴被网友举报违反交通法，此前曾涉无证驾驶 2023-08-29
一年损失近1000亿美元！“零元购” 重创美国零售商财报 2023-08-29
液化气价格大涨近30%，旺季来临下价格将维持高位 2023-08-29
福州方圆大厦交通图福州方圆大厦 2023-08-29
海东市消防救援支队 2023-08-29
明冠新材上半年净利润为5290万元，同比减少43.85% 2023-08-28
两市成交额突破1.1万亿元！有机构称当前是积极孕育新一轮乐观行情的播种时节！ 2023-08-28
大唐无双矮子技能大唐无双矮子 2023-08-28
欠款3年还有效吗 2023-08-28
民生证券给予华友钴业推荐评级 2023年半年报点评：业绩符合预期锂电材料出货量同比大幅增长 2023-08-28
上海市胸科医院是三家医院吗 2023-08-28
湛江2023年养老金重算补发公式湛江退休人员养老金几号发放 2023-08-28
迪阿股份：融资净买入172.55万元，融资余额9540.47万元（08-25） 2023-08-28
逾四成上市券商半年报出炉 3家净利润同比增幅超100% 2023-08-28
泰安线下信用贷款办理泰安个人贷款办理 2023-08-28
上海下周阴雨连成串台风“苏拉”已升级为超强台风级 2023-08-27
北京国企提供2.8万余岗位引才聚智 2023-08-27
康弘药业: 2021年股票期权激励计划首次授予部分第二个行权期及预留授予部分第一个行权期可行权激励对象名单 2023-08-27
不锈钢生锈怎么清洗变亮（不锈钢生锈怎么处理） 2023-08-27
全力自救！碧桂园卖掉亚运城“百亿楼盘”股权 2023-08-27
香江来信丨香港青年周洁莹：讲好“中国故事”，我一直在努力 2023-08-27
湖南省旅游区前7月接待游客超2.21亿人次 2023-08-27
小米color第三方表盘 2023-08-27
99“爱的幸福节”集体婚礼“主角”甜蜜招募中 2023-08-26
南航通报航班起飞前空乘人员摔落：伤者情况稳定 2023-08-26
股东户数最新变动：和晶科技(300279)股东户数2.11万户，较上期减少2.28% 2023-08-26
天葵子，清热解毒，利尿消肿。疮疖肿，乳腺炎，淋巴结结核，跌打损伤，热淋—砂淋，小便不利，毒蛇咬伤 2023-08-26
超豪华海鲜青蟹面，馋了！ 2023-08-26
国家体育总局干部倪会忠，落马 2023-08-26
第一次去酒吧怎么进（第一次去酒吧怎么开台） 2023-08-26
股票行情快报：新强联（300850）8月25日主力资金净卖出635.00万元 2023-08-26
眼霜为什么在护肤的第三步? 眼霜是护肤的第几步呢 2023-08-26
1-7月中国原材料工业整体呈现持续恢复态势 2023-08-25
头狼：早盘1912-1915多单，目前持仓看涨中，看1930 2023-08-25
sq1是什么电气符号 2023-08-25
个人社保缴费基数标准最低是多少个人社保缴费价格表2023年最新 2023-08-25
2023-04-04 21:36 2023-08-25
一图读懂《钢铁行业稳增长工作方案》 2023-08-25
环卫一线清雨忙 2023-08-25
新普互联：让每一次连接，更有价值 2023-08-25
Find N3 Flip 定档8月29 2023-08-25
浙商证券：当下A股有三大流动性底部信号，A股股息率超一年期国债收益率、股票回购潮涌现、基金发行触底 2023-08-25
全国首条525千伏直流海缆通过预鉴定试验 2023-08-25
港资开发商内地竞争格局生变：拿地仍是胜负手 2023-08-25
河源源城区发生 2.8 级地震，震源深度 12 公里 2023-08-25
一个人跳的拉丁舞歌（一个人跳的拉丁舞） 2023-08-24

保险时讯

聚焦百姓

更多>

财产保险