请问什么是结构化稀疏训练啊?[阿里云机器学习PAI]

请问什么是结构化稀疏训练啊?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
4 条回复 A 作者 M 管理员
  1. 您好,稀疏化是指将模型参数中冗余的或不重要的部分剔除(或置为零),从而降低需要存储的参数量,减少需要参与计算的权重。但是直接执行稀疏化操作会对模型性能有一定的影响,因此通常需要通过重新训练或者微调训练保持模型效果。结构化稀疏训练是指在训练过程中考虑稀疏化需求,渐进式地将模型中每层参数处理为指定比例的稀疏度。此外,为保证稀疏化的加速效果,训练过程中将使得模型中的非零参数分布符合特定约束。

  2. 通过对模型进行稀疏正则化训练,得到参数较为稀疏的深度神经网络模型,并结合卷积层和 BN层的稀疏性进行结构化剪枝,去除冗余的滤波器

  3. 结构化稀疏训练是一种机器学习技术,它可以帮助模型更好地捕捉数据中的结构信息,从而提高模型的准确性和效率。它的基本思想是,在训练过程中,通过引入结构化稀疏约束,使模型更加紧凑,从而提高模型的准确性和效率。

  4. 从模型中移除row、column、attention heads、layers,进而设置稀疏化算法,将参数加速比转化为时间加速比;

  5. DeepRec(PAI-TF)是阿里巴巴集团统一的大规模稀疏模型训练/预测引擎,广泛应用于淘宝、天猫、阿里妈妈、高德、淘特、AliExpress、Lazada等,支持了淘宝搜索、推荐、广告等核心业务,支撑着千亿特征、万亿样本的超大规模稀疏训练。 DeepRec在分布式、图优化、算子、Runtime等方面对稀疏模型进行了深度性能优化,同时提供了稀疏场景下特有的Embedding相关功能。 DeepRec项目从2016年开发至今,由阿里巴巴集团内AOP团队、XDL团队、PAI团队、RTP团队以及蚂蚁集团AIInfra团队共建,并且得到了淘宝推荐算法等多个业务算法团队的支持。DeepRec的研发也得到了Intel CESG软件团队、Optane团队和PSU团队,NVIDIA GPU计算专家团队及Merlin HughCTR团队的支持。