请问离线预标注数据文件格式是什么样的?[阿里云机器学习PAI]

请问离线预标注数据文件格式是什么样的?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
1 条回复 A 作者 M 管理员
  1. 您好,离线预标注数据文件的格式需要包含自定义字段和source两个字段,而且自定义字段不能缺少,并且支持添加多个自定义字段。

  2. 准备离线预标注数据文件(prelabel_offline.manifest),并创建为OSS类型的数据集。 – 离线预标注数据文件的格式如下,需要包含自定义字段和source两个字段,且离线预标注数据文件中,自定义字段不能缺少,且支持添加多个自定义字段。

    {    "data": {        "label": "label_2",        "source": "阿里巴巴集团庆祝创立十周年,同时成立阿里云计算"    }}

    其中: label:离线生成的预标注结果。 source:原始数据。 不同标注类型文件的整体格式要求请参见创建数据集:用于数据标注。如果离线预标注数据文件不满足格式要求,可能会导致预标注结果不能正常显示。 – 将离线预标注数据文件创建为数据集时,需创建为OSS类型的数据集