机器学习PAI我离线测了一下, 这里的separator 是针对单特征 多值的分割吗?[阿里云]

机器学习PAI我离线测了一下, 这里的separator 是针对单特征 多值的分割吗? 感觉没生效哇
这个是离线fg的代码吗?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
1 条回复 A 作者 M 管理员
  1. 在机器学习PAI中,separator的确应用于多值特征的分割。例如,有些离散特征可能有多个取值,如一个人喜欢的NBA球队,有的人可能喜欢火箭和湖人,有的人可能只喜欢勇士,也有的人喜欢骑士、绿军、猛龙等一大堆。对于这种特征,需要使用separator进行正确的分隔处理。

    但需要注意的是,这里的separator不仅仅限于对离散特征的分割,它也可以应用于连续型特征的离散化处理。离散化的优势在于它可以映射到高维度空间,使线性的LR更快,且有更好的分割性;同时0,1向量内积乘法运算速度快,计算结果方便存储,容易扩展。

  2. fg_test_extension.json 是max compute的MapReduce 执行用的。
    是的。我理解 multi_val_sep是输入分隔符;sequence_delim 是fg之后的输出分隔符。 ,此回答整理自钉群“【EasyRec】推荐算法交流群”