资源行业动态阿里公布新语音合成技术,97%接近原始录音

阿里公布新语音合成技术,97%接近原始录音

2019-10-25 | |  91 |   0

原标题:阿里公布新语音合成技术,97%接近原始录音 

来源:今日头条


近日,阿里巴巴对外发布了,由达摩院机器智能实验室自主研发的新一代语音合成技术KAN-TTS。据阿里巴巴介绍,新的语音技术可大幅提高合成语音与真人发声的相似度,并将语音合成定制成本降低10倍以上。阿里方面还称,当前业界商用系统的合成语音与原始音频录音的接近程度通常在85%到90%之间,而基于KAN-TTS技术的合成语音可将该数据提高到97%以上。

81bee7faf0dd43dfa722b1727f2c7ace.jpg


资料显示,语音合成是通过机械的、电子的方法产生人造语音的技术。TTS技术(又称文语转换技术)隶属于语音合成,它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力,是当今时代信息产业的重要竞争市场。和语音识别相比,语音合成的技术相对说来要成熟一些,并已开始向产业化方向成功迈进。


此次推出的KAN-TTS,由达摩院机器智能实验室自主研发,深度融合了目前主流的端到端TTS技术和传统TTS技术,从多个方面改进了语音合成。传统语音合成定制需要10小时以上的数据录制和标注,对录音人和录音环境要求很高。从启动定制到最终交付,项目周期长成本高。

而现在,阿里利用Multi-Speaker Model与Speaker-aware Advanced Transfer Learning相结合的方法,将语音合成定制成本降低10倍以上,周期压缩3倍以上。也就是说,用1小时有效录音数据和不到两个月制作周期,就能完成一次标准TTS定制。此外,这使得普通用户定制“AI声音”的门槛更低,只需手机录音十分钟,就能获得与录制声音高度相似的合成语音。


在语音合成领域,阿里已经推出了诸如天猫精灵等商用产品。天猫精灵是阿里巴巴人工智能实验室开发的第一款智能语音助手,也是其消费级AI产品研发的首批成果。据阿里巴巴A.I. Labs产品与运营总经理杜海涛介绍称,“过去18个月里,我们完成了110亿次的天猫精灵唤醒,回答了用户100亿个问题,并且我们认识了1500万中国人。过去我们的技能增长了120%,同时我们现在已经覆盖了市面上70%以上可连接的家庭设备”。在新技术的成功推广之下,广大用户将能通过天猫听到更富情感、更加人性化的语音服务了。

THE END

免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:从不温不火到炙手可热:语音识别技术简史

下一篇:智能手机的超性能语音识别技术

用户评价
全部评价

热门资源

  • 国内人才报告:机...

    近日,BOSS 直聘职业科学实验室 &BOSS 直聘研究院...

  • AI使物联网更智能...

    看到微软对物联网和人工智能的结合感兴趣是一个明...

  • 推荐一批学习自然...

    这里推荐一批学习自然语言处理相关的书籍,当然,...

  • 安防智能化大势下...

    大部分传统安防设备不仅拍摄视野有限,而且无法事...

  • 20亿创业基金、10...

    近日,杭州举办了建设国家新一代人工智能创新发展...