请问PAI-DSW中使用EasyASR进行语音识别流程大概是怎样的?[阿里云机器学习PAI]

请问PAI-DSW中使用EasyASR进行语音识别流程大概是怎样的?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
2 条回复 A 作者 M 管理员
  1. 1.步骤一:准备数据 下载语音识别的训练数据。

    2.步骤二:构建数据集与训练模型 将数据转换为TFRecord格式,并进行ASR模型训练。

    3.步骤三:评估并导出模型 模型训练完成后,需要对模型的精准度进行评测。如果对模型满意,则可以将训练好的模型导出为SavedModel,进行分布批量预测。

    4.步骤四:模型预测 您可以使用导出的SavedModel模型进行预测。

  2. EasyASR(语音智能增强算法包)提供多种模型的训练及预测功能,旨在帮助语音智能应用开发者方便快捷地构建语音模型并应用于生产。 在PAI-DSW中使用EasyASR算法包。 前提条件 已创建PAI-DSW实例,且该实例满足版本限制,建议使用GPU版本的PAI-DSW实例。 背景信息, 采用wav2letter-small模型作为预训练模型,除此之外,PAI还提供了wav2letter-base、transformer-small及transfromer-base三个预训练的ASR模型,供您使用。您只需要下载对应的文件,并使用其替换操作流程中的相应输入即可。 使用限制 EasyASR仅支持如下Python版本和TensorFlow版本: 仅支持Python 3.6版本。 支持TensorFlow 1.12或PAI-TensorFlow 1.15版本。 不支持所有的PyTorch版本。 建议采用PAI-DSW的镜像tensorflow:1.12PAI-gpu-py36-cu101-ubuntu18.04或tensorflow:1.15-gpu-py36-cu100-ubuntu18.04。 操作流程 在PAI-DSW中使用EasyASR进行语音识别的流程如下: 步骤一:准备数据 下载语音识别的训练数据。

    步骤二:构建数据集与训练模型 将数据转换为TFRecord格式,并进行ASR模型训练。

    步骤三:评估并导出模型 模型训练完成后,需要对模型的精准度进行评测。如果对模型满意,则可以将训练好的模型导出为SavedModel,进行分布批量预测。

    步骤四:模型预测 您可以使用导出的SavedModel模型进行预测。

  3. 我总结了一下给你,希望对你有帮助! PAI-DSW中使用EasyASR进行语音识别流程大致如下:

    1.首先,使用EasyASR提供的语音识别模型,将语音输入转换为文本;

    2.然后,使用PAI-DSW提供的文本分析模型,对文本进行分析;

    3.最后,根据分析结果,进行相应的处理。