发表于：2023-2-5 20:32:290次点击

我现在有一个flink任务，部署在k8s上，老是报oom kill。并且任务重启之后报akka fr[阿里云实时计算 Flink版]

我现在有一个flink任务，部署在k8s上，老是报oom kill。并且任务重启之后报akka frame size不够，请问这种是由于增量checkpoint保存的文件路径过多导致的吗？还是啥原因啊？目前TM 4g大小，数据量不大，资源我感觉是很足够的，但是还是oom kill了，应该是overhead 内存不够导致的，但是不知道怎么解决了

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

1 条回复 A 作者 M 管理员

认真学习的heartAM 2023-11-27 18:12:34 1

这种情况的原因可能有很多，不仅仅是增量checkpoint的问题，也可能是flink任务配置不合适导致的内存问题，例如缓存策略、操作符的并行度、网络带宽、JVM堆内存的配置等。

在这种情况下，您需要诊断以下方面的问题：

检查checkpoint设置：比如checkpoint的保存位置是否过大，以及checkpoint的间隔是否合适。

检查任务配置：是否对flink任务的缓存策略、操作符的并行度、网络带宽进行了合适的配置。

检查JVM内存配置：是否对JVM堆内存进行了合适的配置。

在诊断过程中，建议使用flink自带的性能诊断工具，以及分析任务日志等方法，来进一步诊断内存问题。

已喜欢已反对
码字王AM 2023-11-27 18:12:34 2

看下tm内存图

此答案来自钉钉群“【2】Apache Flink China 社区”

已喜欢已反对

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

我现在有一个flink任务，部署在k8s上，老是报oom kill。并且任务重启之后报akka fr[阿里云实时计算 Flink版] 暂停朗读为您朗读

我现在有一个flink任务，部署在k8s上，老是报oom kill。并且任务重启之后报akka fr[阿里云实时计算 Flink版]