原标题:语音识别的架构
来源:CSDN博客 [alice_tl]
语音识别系统语音识别系统是一个先编码后解码的过程,主要包括语音信号的采样和预处理部分、特征参数提取部分、语音识别核心部分以及语音识别后处理部分。
可以看下方的架构图。
Speech,原始语音信号
Feature Extraction,特征抽取,由原始的语音得到语音向量。
Acoustic Model、Language Model、Pronunciation Dictionary,使用声学模型和、字典、语言模型对语音向量进行解码。
特征提取、模型和搜索算法三部分构成了一个语音识别系统。也可以看这个图。
从AI的架构来理解,就是:
基础层:语音信号的采集、降噪等预处理
技术层:语音的特征提取、声学模型训练、解码搜索、语言模型训练
应用层:识别结果输出
————————————————
版权声明:本文为CSDN博主「alice_tl」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/alice_tl/article/details/97434318
一THE END一
免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。
合作及投稿邮箱:E-mail:editor@tusaishared.com