机器学习PAI使用blade之后出现cuda内存越界访问的问题,用compute-sanitier发现是上面的kernel越界了,请教一下这个怎么对应到原始graph,或者有好的方式进一步分析吗?比如是codegen有问题,还是输入的问题
请教一下这个怎么对应到原始graph,或者有好的方式进一步分析吗?[阿里云机器学习PAI]
「点点赞赏,手留余香」
还没有人赞赏,快来当第一个赞赏的人吧!
机器学习PAI使用blade之后出现cuda内存越界访问的问题,用compute-sanitier发现是上面的kernel越界了,请教一下这个怎么对应到原始graph,或者有好的方式进一步分析吗?比如是codegen有问题,还是输入的问题