请教个flink问题:如何排查source到sink中间-d的数据是怎么丢的呢?[阿里云实时计算 Flink版]

大佬们请教个flink问题:
kafka读数据,中间关联hbase维表,再落kafka;
在此期间,hbase集群故障,导致任务报hbase 异步IO超时,无限重启,ck失败;
集群恢复正常后从最后的ck恢复任务,结果丢失了一部分-d的changelog,导致多出来一部分数据.目前能定位到这部分数据是在hbase故障期间进kafka source 的;如何排查source到sink中间-d的数据是怎么丢的呢?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====