机器学习PAI只能用再建一个 done分区的方式吗？instance.status 这种方式可行吗？[阿里云机器学习PAI]

机器学习PAI只能用再建一个 done分区的方式吗？instance.status 这种方式可行吗？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

2 条回复 A 作者 M 管理员

xin在这AM 2023-11-28 2:54:29 1

没有表分区对应instance id的概念。但是你可以从openapi拿到所有实例，https://help.aliyun.com/zh/dataworks/developer-reference/api-listinstances，此回答整理自钉群“【EasyRec】推荐算法交流群”

已喜欢已反对
sun20AM 2023-11-28 2:54:29 2

机器学习PAI不仅可以通过再建一个done分区的方式来进行模型部署，还可以使用instance.status来进行部署。

在PAI中，可以通过创建一个作业来定义训练、验证和测试数据集，并指定要使用的计算资源和其他参数。当作业创建成功后，可以将其保存为done分区。done分区是一种特殊的分区，用于保存训练、验证和测试数据集以及其他与模型训练相关的参数和设置。当需要重新训练模型或重新部署模型时，可以通过加载done分区来快速恢复之前的训练环境和数据集，从而节省时间和计算资源。

除了使用done分区，还可以使用instance.status来进行模型部署。instance.status是一个属性，可以用来表示实例的状态。在PAI中，可以使用instance.status来指定实例的状态，例如running、stopped、failed等。通过设置instance.status属性，可以控制实例的启动和停止，从而实现模型部署的灵活性和可扩展性。

总之，机器学习PAI可以通过多种方式来进行模型部署，包括再建一个done分区和使用instance.status属性。具体选择哪种方式取决于具体的应用场景和需求。

已喜欢已反对
小周sirAM 2023-11-28 2:54:29 3

在阿里云机器学习平台 PAI 上，可以使用不同的方式来标识训练任务的状态，包括但不限于 “done” 分区。

一种常见的做法是使用 PAI 的状态 API 来获取训练任务的状态。例如，您可以使用 GET /api/job/{job_id} 或 GET /api/train/{train_id} 来获取训练任务的状态信息。其中，job_id 和 train_id 是指训练任务的唯一标识符。这些 API 返回的状态信息中包含了训练任务的各种详细信息，包括进度、错误消息、完成度等。

另一种做法是在训练完成后创建一个新的分区。这是一种可选的辅助手段，可以让您更容易地追踪训练过程，特别是在多次迭代或分布式训练中

已喜欢已反对

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

机器学习PAI只能用再建一个 done分区的方式吗？instance.status 这种方式可行吗？[阿里云机器学习PAI] 暂停朗读为您朗读

机器学习PAI只能用再建一个 done分区的方式吗？instance.status 这种方式可行吗？[阿里云机器学习PAI]