tongchenkeji 发表于:2023-10-22 22:16:010次点击 已关注取消关注 关注 私信 机器学习PAI我们这边有个pai-eas服务rt尖刺很大,但是cpu和内存很低 帮忙看下什么情况吗?[阿里云机器学习PAI] 暂停朗读为您朗读 机器学习PAI我们这边有个pai-eas服务rt尖刺很大,但是cpu和内存很低 可以帮忙看下什么情况吗? 「点点赞赏,手留余香」 赞赏 还没有人赞赏,快来当第一个赞赏的人吧! 海报 机器学习PAI# 人工智能平台 PAI1410# 机器学习深度学习1219
小周sirAM 2023-11-28 3:00:01 1 从你提供的信息来看,PAI-EAS服务的RT(响应时间)尖刺很大,但是CPU和内存使用率很低。这可能表明该服务的处理能力不足,导致服务处理请求的速度较慢。建议您可以从以下几个方面进行排查: 检查PAI-EAS服务的负载情况。如果负载较低,可能是因为服务的处理能力不足。您可以尝试增加服务的处理能力,例如增加服务的CPU和内存资源。 检查PAI-EAS服务的代码。如果服务的代码存在问题,可能会导致服务处理请求的速度较慢。您可以尝试优化服务的代码,以提高服务的处理能力。 检查PAI-EAS服务的网络环境。如果服务的网络环境存在问题,可能会导致服务处理请求的速度较慢。您可以尝试优化服务的网络环境,以提高服务的处理能力。 检查PAI-EAS服务的硬件设备。如果服务的硬件设备存在问题,可能会导致服务处理请求的速度较慢。您可以尝试更换服务的硬件设备,以提高服务的处理能力。
sun20AM 2023-11-28 3:00:01 2 如果你的PAI-EAS服务的RT(响应时间)很高,但CPU和内存的使用率却很低,可能有以下几种可能: 网络问题:可能是网络延迟或者网络不稳定导致的。 任务调度问题:可能是任务调度器的工作负载过大,导致任务的响应时间过长。 硬件问题:可能是服务器硬件出现问题,如硬盘IO瓶颈等。 软件问题:可能是PAI-EAS服务本身存在问题,如代码bug、配置问题等。 建议你检查一下网络状况,优化一下任务调度策略,检查一下服务器的硬件状态,以及检查一下PAI-EAS服务的代码和配置。
xin在这AM 2023-11-28 3:00:01 3 EAS的RT监控,你可以就理解为一个Nginx类似的网关的监控,记录一个请求从发给到容器的模型服务,到模型服务返回结果的时间。这里的RT主要取决于你们的模型服务本身,包括模型,以及相关的业务代码。,此回答整理自钉群“机器学习PAI交流群(答疑@值班)”
从你提供的信息来看,PAI-EAS服务的RT(响应时间)尖刺很大,但是CPU和内存使用率很低。这可能表明该服务的处理能力不足,导致服务处理请求的速度较慢。建议您可以从以下几个方面进行排查:
如果你的PAI-EAS服务的RT(响应时间)很高,但CPU和内存的使用率却很低,可能有以下几种可能:
网络问题:可能是网络延迟或者网络不稳定导致的。
任务调度问题:可能是任务调度器的工作负载过大,导致任务的响应时间过长。
硬件问题:可能是服务器硬件出现问题,如硬盘IO瓶颈等。
软件问题:可能是PAI-EAS服务本身存在问题,如代码bug、配置问题等。
建议你检查一下网络状况,优化一下任务调度策略,检查一下服务器的硬件状态,以及检查一下PAI-EAS服务的代码和配置。
EAS的RT监控,你可以就理解为一个Nginx类似的网关的监控,记录一个请求从发给到容器的模型服务,到模型服务返回结果的时间。
这里的RT主要取决于你们的模型服务本身,包括模型,以及相关的业务代码。,此回答整理自钉群“机器学习PAI交流群(答疑@值班)”