机器学习PAI想咨询一下,是否支持不做embedding层,直接将特征原值作为输入呢?[阿里云机器学习PAI]

机器学习PAI想咨询一下,easyrec做RawFeature这种连续值特征输入时,是否支持不做embedding层,直接将特征原值作为输入呢?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
2 条回复 A 作者 M 管理员
  1. 在阿里云的机器学习PAI(Platform for AI Innovation)中,EasyRec模型对于连续值特征(即RawFeature)的处理方式是将其转换为数值向量,而不是直接使用原始值。这是因为深度学习模型通常需要输入数值向量,而不是原始的数值。

    然而,如果你确实希望保留原始值,你可以尝试使用一些其他的机器学习模型,比如逻辑回归或者线性回归,这些模型可以直接接受原始值作为输入。

    另外,如果你希望在模型中保留原始值,你也可以考虑使用一些特定的预处理方法,比如归一化或者标准化,这些方法可以帮助你在保持原始值的同时,将其转换为模型可以接受的格式。

  2. 支持,不配置embedding_dim就好了.easyrec做RawFeature这种连续值特征输入时,是否支持不做embedding层,直接将特征原值作为输入,根据已知的参考内容信息,可以将连续值特征直接作为输入,不需要做embedding层。因此,easyrec支持不做embedding层,直接将特征原值作为输入。,此回答整理自钉群“【EasyRec】推荐算法交流群”

  3. 如果你想要避免使用Embedding层,你可以考虑将连续值特征转换为类别特征,然后再将其作为输入。这可以通过 pandas.get_dummies() 函数或者 sklearn.preprocessing.OrdinalEncoder 类实现。但是请注意,这种方法可能会导致特征维度的增加,从而增加模型的复杂性。