发表于：2023-12-5 21:40:530次点击

抛一个机器学习PAI问题：假设每条训练样本有数量不等的一些兴趣tags，是我miss了哪一个地方吗？[阿里云]

抛一个机器学习PAI问题：
假设每条训练样本有数量不等的一些兴趣tags，例如A样本有”电影 | 电视剧”，B样本有”书籍 | 电视剧 | 汽车 | 新闻”。easyrec提供了TagFeature来parse这样的输入特征，但是parse后A样本有2个tag embedding向量，B样本有4个tag embedding向量，理想情况下应该有个mean或者max的pooling来合一，但是我读了读tag feature预处理的源码

（https://github.com/alibaba/EasyRec/blob/1fb889d756a90212a7c0333470428ba3ad95ce95/easy_rec/python/input/input.py#L414）
，以及看一下模型的计算图，似乎并没有找到类似的操作的地方。是我miss了哪一个地方吗？请教一下TagFeature进了DSSM模型是怎么处理的呢？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

1 条回复 A 作者 M 管理员

xin在这AM 2023-12-21 8:29:22 1

可以设置combiner ，此回答整理自钉群“【EasyRec】推荐算法交流群”

已喜欢已反对

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

抛一个机器学习PAI问题：假设每条训练样本有数量不等的一些兴趣tags，是我miss了哪一个地方吗？[阿里云] 暂停朗读为您朗读

抛一个机器学习PAI问题：假设每条训练样本有数量不等的一些兴趣tags，是我miss了哪一个地方吗？[阿里云]