tongchenkeji 发表于:2023-3-27 21:31:240次点击 已关注取消关注 关注 私信 如果遇到节点遇到慢,导致下游全部异常,可以怎么解决?[阿里云MaxCompute] 暂停朗读为您朗读 如果遇到节点遇到慢,导致下游全部异常, 慢在还有一堆之前的节点还没运行,重跑是正常的3月24日,可以怎么快速解决下? 「点点赞赏,手留余香」 赞赏 还没有人赞赏,快来当第一个赞赏的人吧! 海报 MaxCompute# 云原生大数据计算服务 MaxCompute3255
意中人jswyAM 2023-11-27 18:17:48 1 看下卡在哪个节点 看卡主的运行日志慢在哪里。 如果下游节点对堵塞的上游节点没有数据依赖,可以直接右键堵塞的节点置成功,下游就会正常跑了。(此回答整理自钉钉群“MaxCompute开发者社区2群”)
LittlePenguinAM 2023-11-27 18:17:48 2 以下是几个可能的解决方案: 提升节点的资源配置,如增加节点的 CPU、内存等资源,以提升节点的处理能力。 调整 maxcompute任务的并发数,减少任务执行的并行度,以降低对节点的负载压力。 检查节点运行时的日志和监控数据,找出导致节点慢的原因,如网络延迟、文件读写等等,并作出相应的优化。 如果节点慢的原因是数据倾斜导致的,则可以考虑采用数据倾斜解决方案,如改变数据分布、增加或减少分区等等。 如果节点慢导致下游任务全部异常,可以通过手动重启下游任务来快速解决问题。另外,也可以考虑使用调度工具对任务依赖关系进行管理,以避免下游任务异常对整个任务流程的影响。
看下卡在哪个节点 看卡主的运行日志慢在哪里。 如果下游节点对堵塞的上游节点没有数据依赖,可以直接右键堵塞的节点置成功,下游就会正常跑了。(此回答整理自钉钉群“MaxCompute开发者社区2群”)
以下是几个可能的解决方案:
提升节点的资源配置,如增加节点的 CPU、内存等资源,以提升节点的处理能力。
调整 maxcompute任务的并发数,减少任务执行的并行度,以降低对节点的负载压力。
检查节点运行时的日志和监控数据,找出导致节点慢的原因,如网络延迟、文件读写等等,并作出相应的优化。
如果节点慢的原因是数据倾斜导致的,则可以考虑采用数据倾斜解决方案,如改变数据分布、增加或减少分区等等。
如果节点慢导致下游任务全部异常,可以通过手动重启下游任务来快速解决问题。另外,也可以考虑使用调度工具对任务依赖关系进行管理,以避免下游任务异常对整个任务流程的影响。