资源技术动态语音识别的架构

语音识别的架构

2020-02-18 | |  91 |   0

原标题:语音识别的架构 

来源:CSDN博客   [alice_tl]


语音识别系统语音识别系统是一个先编码后解码的过程,主要包括语音信号的采样和预处理部分、特征参数提取部分、语音识别核心部分以及语音识别后处理部分。


可以看下方的架构图。

1581992478796881.png

Speech,原始语音信号


Feature Extraction,特征抽取,由原始的语音得到语音向量。


Acoustic Model、Language Model、Pronunciation Dictionary,使用声学模型和、字典、语言模型对语音向量进行解码。


特征提取、模型和搜索算法三部分构成了一个语音识别系统。也可以看这个图。

1581992512768338.png

从AI的架构来理解,就是:

1581992556821967.png

基础层:语音信号的采集、降噪等预处理


技术层:语音的特征提取、声学模型训练、解码搜索、语言模型训练


应用层:识别结果输出

————————————————

版权声明:本文为CSDN博主「alice_tl」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/alice_tl/article/details/97434318

THE END

免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:讯飞语音识别demo实现

下一篇:数字图像的梯度概念(the gradient of the image)

用户评价
全部评价

热门资源

  • 应用笔画宽度变换...

    应用背景:是盲人辅助系统,城市环境中的机器导航...

  • GAN之根据文本描述...

    一些比较好玩的任务也就应运而生,比如图像修复、...

  • 端到端语音识别时...

    从上世纪 50 年代诞生到 2012 年引入 DNN 后识别效...

  • 人体姿态估计的过...

    人体姿态估计是计算机视觉中一个很基础的问题。从...

  • 谷歌发布TyDi QA语...

    为了鼓励对多语言问答技术的研究,谷歌发布了 TyDi...