tongchenkeji 发表于:2023-12-10 17:01:340次点击 已关注取消关注 关注 私信 机器学习PAI我离线测了一下, 这里的separator 是针对单特征 多值的分割吗?[阿里云] 暂停朗读为您朗读 机器学习PAI我离线测了一下, 这里的separator 是针对单特征 多值的分割吗? 感觉没生效哇这个是离线fg的代码吗? 「点点赞赏,手留余香」 赞赏 还没有人赞赏,快来当第一个赞赏的人吧! 海报 阿里云# 人工智能平台 PAI1410# 机器学习深度学习1219
小周sirAM 2023-12-21 8:09:49 1 在机器学习PAI中,separator的确应用于多值特征的分割。例如,有些离散特征可能有多个取值,如一个人喜欢的NBA球队,有的人可能喜欢火箭和湖人,有的人可能只喜欢勇士,也有的人喜欢骑士、绿军、猛龙等一大堆。对于这种特征,需要使用separator进行正确的分隔处理。 但需要注意的是,这里的separator不仅仅限于对离散特征的分割,它也可以应用于连续型特征的离散化处理。离散化的优势在于它可以映射到高维度空间,使线性的LR更快,且有更好的分割性;同时0,1向量内积乘法运算速度快,计算结果方便存储,容易扩展。
xin在这AM 2023-12-21 8:09:49 2 fg_test_extension.json 是max compute的MapReduce 执行用的。是的。我理解 multi_val_sep是输入分隔符;sequence_delim 是fg之后的输出分隔符。 ,此回答整理自钉群“【EasyRec】推荐算法交流群”
在机器学习PAI中,separator的确应用于多值特征的分割。例如,有些离散特征可能有多个取值,如一个人喜欢的NBA球队,有的人可能喜欢火箭和湖人,有的人可能只喜欢勇士,也有的人喜欢骑士、绿军、猛龙等一大堆。对于这种特征,需要使用separator进行正确的分隔处理。
但需要注意的是,这里的separator不仅仅限于对离散特征的分割,它也可以应用于连续型特征的离散化处理。离散化的优势在于它可以映射到高维度空间,使线性的LR更快,且有更好的分割性;同时0,1向量内积乘法运算速度快,计算结果方便存储,容易扩展。
fg_test_extension.json 是max compute的MapReduce 执行用的。
是的。我理解 multi_val_sep是输入分隔符;sequence_delim 是fg之后的输出分隔符。 ,此回答整理自钉群“【EasyRec】推荐算法交流群”