机器学习PAI 我用这样的方式跑多机的resnet_split,两个服务器会卡住,still waiting的消息也不打印了应该是连接上了但是不继续往下走?
这是服务器1
这是服务器2 这是什么原因?
机器学习PAI 我用这样的方式跑多机的resnet_split,两个服务器会卡住?[阿里云机器学习PAI]
「点点赞赏,手留余香」
还没有人赞赏,快来当第一个赞赏的人吧!
机器学习PAI 我用这样的方式跑多机的resnet_split,两个服务器会卡住,still waiting的消息也不打印了应该是连接上了但是不继续往下走?
这是服务器1
这是服务器2 这是什么原因?