tongchenkeji 发表于:2023-11-5 16:28:470次点击 已关注取消关注 关注 私信 机器学习PAI只能用再建一个 done分区的方式吗?instance.status 这种方式可行吗?[阿里云机器学习PAI] 暂停朗读为您朗读 机器学习PAI只能用再建一个 done分区的方式吗?instance.status 这种方式可行吗? 「点点赞赏,手留余香」 赞赏 还没有人赞赏,快来当第一个赞赏的人吧! 海报 机器学习PAI# 人工智能平台 PAI1410# 机器学习深度学习1219
xin在这AM 2023-11-28 2:54:29 1 没有表分区对应instance id的概念。但是你可以从openapi拿到所有实例,https://help.aliyun.com/zh/dataworks/developer-reference/api-listinstances,此回答整理自钉群“【EasyRec】推荐算法交流群”
sun20AM 2023-11-28 2:54:29 2 机器学习PAI不仅可以通过再建一个done分区的方式来进行模型部署,还可以使用instance.status来进行部署。 在PAI中,可以通过创建一个作业来定义训练、验证和测试数据集,并指定要使用的计算资源和其他参数。当作业创建成功后,可以将其保存为done分区。done分区是一种特殊的分区,用于保存训练、验证和测试数据集以及其他与模型训练相关的参数和设置。当需要重新训练模型或重新部署模型时,可以通过加载done分区来快速恢复之前的训练环境和数据集,从而节省时间和计算资源。 除了使用done分区,还可以使用instance.status来进行模型部署。instance.status是一个属性,可以用来表示实例的状态。在PAI中,可以使用instance.status来指定实例的状态,例如running、stopped、failed等。通过设置instance.status属性,可以控制实例的启动和停止,从而实现模型部署的灵活性和可扩展性。 总之,机器学习PAI可以通过多种方式来进行模型部署,包括再建一个done分区和使用instance.status属性。具体选择哪种方式取决于具体的应用场景和需求。
小周sirAM 2023-11-28 2:54:29 3 在阿里云机器学习平台 PAI 上,可以使用不同的方式来标识训练任务的状态,包括但不限于 “done” 分区。 一种常见的做法是使用 PAI 的状态 API 来获取训练任务的状态。例如,您可以使用 GET /api/job/{job_id} 或 GET /api/train/{train_id} 来获取训练任务的状态信息。其中,job_id 和 train_id 是指训练任务的唯一标识符。这些 API 返回的状态信息中包含了训练任务的各种详细信息,包括进度、错误消息、完成度等。 另一种做法是在训练完成后创建一个新的分区。这是一种可选的辅助手段,可以让您更容易地追踪训练过程,特别是在多次迭代或分布式训练中
没有表分区对应instance id的概念。但是你可以从openapi拿到所有实例,https://help.aliyun.com/zh/dataworks/developer-reference/api-listinstances,此回答整理自钉群“【EasyRec】推荐算法交流群”
机器学习PAI不仅可以通过再建一个done分区的方式来进行模型部署,还可以使用instance.status来进行部署。
在PAI中,可以通过创建一个作业来定义训练、验证和测试数据集,并指定要使用的计算资源和其他参数。当作业创建成功后,可以将其保存为done分区。done分区是一种特殊的分区,用于保存训练、验证和测试数据集以及其他与模型训练相关的参数和设置。当需要重新训练模型或重新部署模型时,可以通过加载done分区来快速恢复之前的训练环境和数据集,从而节省时间和计算资源。
除了使用done分区,还可以使用instance.status来进行模型部署。instance.status是一个属性,可以用来表示实例的状态。在PAI中,可以使用instance.status来指定实例的状态,例如running、stopped、failed等。通过设置instance.status属性,可以控制实例的启动和停止,从而实现模型部署的灵活性和可扩展性。
总之,机器学习PAI可以通过多种方式来进行模型部署,包括再建一个done分区和使用instance.status属性。具体选择哪种方式取决于具体的应用场景和需求。
在阿里云机器学习平台 PAI 上,可以使用不同的方式来标识训练任务的状态,包括但不限于 “done” 分区。
一种常见的做法是使用 PAI 的状态 API 来获取训练任务的状态。例如,您可以使用
GET /api/job/{job_id}
或GET /api/train/{train_id}
来获取训练任务的状态信息。其中,job_id
和train_id
是指训练任务的唯一标识符。这些 API 返回的状态信息中包含了训练任务的各种详细信息,包括进度、错误消息、完成度等。另一种做法是在训练完成后创建一个新的分区。这是一种可选的辅助手段,可以让您更容易地追踪训练过程,特别是在多次迭代或分布式训练中