机器学习PAI 我用这样的方式跑多机的resnet_split,两个服务器会卡住?[阿里云机器学习PAI]

机器学习PAI 我用这样的方式跑多机的resnet_split,两个服务器会卡住,still waiting的消息也不打印了应该是连接上了但是不继续往下走?
这是服务器1

这是服务器2 这是什么原因?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====