资源技术动态一句话语音识别API接入步骤和说明

一句话语音识别API接入步骤和说明

2019-11-08 | |  75 |   0

原标题:数据标注师 人工智能背后的人工力量     来源:人工智能媒体平台

链接:http://www.atyun.com/42329.html


语音识别 API 升级到 3.0 版本。全新的 API 接口文档更加规范和全面,统一的参数风格和公共错误码,统一的 SDK/CLI 版本与 API 文档严格一致,给您带来简单快捷的使用体验。支持全地域就近接入让您更快连接腾讯云产品。


相关接口

接口名称:SentenceRecognition


接口功能:一句话识别, 对60秒之内的短音频文件进行识别,达到快速准确识别较短语音的效果,可应用于语音消息转写等场景。


接口描述

接口请求域名: asr.tencentcloudapi.com 。


本接口用于对60秒之内的短音频文件进行识别,支持本地语音文件上传和语音URL上传两种请求方式。


当音频文件通过请求中body内容上传时,请求大小不能超过600KB;当音频以url方式传输时,音频时长不可超过60s。


所有请求参数放在POST请求的body中,编码类型采用x-www-form-urlencoded,参数进行urlencode编码后传输。


现暂只支持中文普通话和带有一定方言口音的中文普通话识别,支持识别8k16bit和16k16bit的mp3或者wav格式的单声道音频。


默认接口请求频率限制:25次/秒。


输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见:cloud.tencent.com/document/api/1093/35640

image.png


输出参数

image.png


示例

通过语音URL形式调用接口:


用户通过语音url(http%3A%2F%2Ftest-1256085166.cos.ap-guangzhou.myqcloud.com%2Fcase13.wav)的方式(SourceType为0)请求一句话识别服务,服务的引擎模型为:电话 8k (EngSerViceType = 8k),一句话语音的采样率为8k,声道数为单声道,长度为159768字节。


输入:

  https://asr.tencentcloudapi.com/?Action=SentenceRecognition

  &ProjectId=0

  &SubServiceType=2

  &EngSerViceType=8k

  &SourceType=0

  &Url=http%3A%2F%2Ftest-1256085166.cos.ap-guangzhou.myqcloud.com%2Fcase13.wav

  &SecretId=111

  &Timestamp=111

  &VoiceFormat=wav

  &UsrAudioKey=www

  &DataLen=159768

  &<公共请求参数>


输出:

{

   "Response": {

      "Result": "张先生,您好。那个为了规范保险从业人员的销售行为,也为了更好的保护您的合法权益。",

     "RequestId": "8984d9a9-343f-4c67-8fd9-5c79510a12da"

   }

}

开发者资源

API Explorer:该工具提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力,能显著降低使用云 API 的难度,推荐使用:console.cloud.tencent.com/api/explorer?Product=asr&Version=2019-06-14&Action=SentenceRecognition&SignVersion=


命令行工具:cloud.tencent.com/document/product/440/6176


错误码

业务逻辑相关

image.png

image.png


公共错误码:返回结果中如果存在 Error 字段,则表示调用 API 接口失败。 Error 中的 Code 字段表示错误码,所有业务都可能出现的错误码为公共错误码,下表列出了公共错误码。

image.png

image.png

文章来源腾讯云 ,查看更多相关文档请访问https://cloud.tencent.com/document/product

THE END

免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:英伟达最新推出部署边缘设备的语音识别技术

下一篇:揭秘通用机器翻译:未来能够破解外星人语言?

用户评价
全部评价

热门资源

  • 应用笔画宽度变换...

    应用背景:是盲人辅助系统,城市环境中的机器导航...

  • GAN之根据文本描述...

    一些比较好玩的任务也就应运而生,比如图像修复、...

  • 端到端语音识别时...

    从上世纪 50 年代诞生到 2012 年引入 DNN 后识别效...

  • 人体姿态估计的过...

    人体姿态估计是计算机视觉中一个很基础的问题。从...

  • 谷歌发布TyDi QA语...

    为了鼓励对多语言问答技术的研究,谷歌发布了 TyDi...