机器学习PAI现在有个模型用blade跟trt比，gpu利用率会高20%左右，这个一般怎么分析一下？[阿里云机器学习PAI]

请教一下，机器学习PAI现在有个模型用blade跟trt比，gpu利用率会高20%左右，这个一般怎么分析一下？nsys可以看到有些matmul的kernel选择跟trt是不同的

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

1 条回复 A 作者 M 管理员

HaydenGuoAM 2023-11-28 2:53:12 1
可以考虑以下几点：

计算密集型操作的优化：通过对matmul等计算密集型操作进行优化，可以提高GPU计算利用率，从而加速模型推理。

算法选择的优化：通过使用更优秀的算法，可以减少GPU计算资源的浪费，从而提高GPU利用率。

并行计算的优化：通过使用并行计算的方式，可以充分利用GPU的多个计算核心，从而提高计算效率和GPU利用率。

在以上基础上，可以根据NSys的分析结果，进一步了解每个kernel的选择和执行情况，从而进行更深入的分析和优化。
已喜欢已反对
微笑向日葵AM 2023-11-28 2:53:12 2

这个把batch size从1024改成512之后，gpu利用率降下来了，此回答整理自钉群“BladeDISC用户支持群”

已喜欢已反对

机器学习PAI现在有个模型用blade跟trt比，gpu利用率会高20%左右，这个一般怎么分析一下？[阿里云机器学习PAI] 暂停朗读为您朗读