tongchenkeji 发表于:2023-4-25 16:59:470次点击 已关注取消关注 关注 私信 机器学习PAI中单机4卡, 需要在进程内设置 CUDA_VISIBLE_DEVICES吗?[阿里云机器学习PAI] 暂停朗读为您朗读 机器学习PAI中有一个问题, 单机4卡, 需要在进程内设置 CUDA_VISIBLE_DEVICES 吗? 「点点赞赏,手留余香」 赞赏 还没有人赞赏,快来当第一个赞赏的人吧! 海报 机器学习PAI# 人工智能平台 PAI1410# 机器学习深度学习1219
wljslmzAM 2023-11-28 3:05:18 1 如果您在阿里云机器学习PAI中使用单机多卡进行深度学习训练,需要在进程内设置CUDA_VISIBLE_DEVICES环境变量来指定使用哪些GPU卡进行训练。具体来说,您可以在训练脚本中添加以下代码来设置环境变量: import osos.environ["CUDA_VISIBLE_DEVICES"] = "0,1,2,3" # 指定使用的GPU卡号 上述代码中,将CUDA_VISIBLE_DEVICES设置为”0,1,2,3″表示使用4个GPU卡进行训练。如果您只想使用其中的一部分GPU卡,可以将卡号按照逗号分隔,例如”0,1″表示使用前两个GPU卡进行训练。注意,如果您不设置CUDA_VISIBLE_DEVICES环境变量,则默认会使用所有可用的GPU卡进行训练,这可能会导致资源浪费和性能下降。
如果您在阿里云机器学习PAI中使用单机多卡进行深度学习训练,需要在进程内设置CUDA_VISIBLE_DEVICES环境变量来指定使用哪些GPU卡进行训练。具体来说,您可以在训练脚本中添加以下代码来设置环境变量:
上述代码中,将CUDA_VISIBLE_DEVICES设置为”0,1,2,3″表示使用4个GPU卡进行训练。如果您只想使用其中的一部分GPU卡,可以将卡号按照逗号分隔,例如”0,1″表示使用前两个GPU卡进行训练。注意,如果您不设置CUDA_VISIBLE_DEVICES环境变量,则默认会使用所有可用的GPU卡进行训练,这可能会导致资源浪费和性能下降。
需要的,此回答整理自钉群“DeepRec用户群”