“倾听”1分钟，就能开口模仿人类“讲话” 新款人工智能语音系统高效率复制人声

　　原题目：“倾听”1分钟，就能启齿仿照人类“讲话”

　　据《科学美国人》杂志网站2日报道，加拿大新创公司琴鸟(Lyrebird)发布了新款人工智能(AI)语音体系，其能通过度析讲话灌音和对应文本以及两者之间的关联，在1分钟内仿照人类“讲话”，好比，仿照特朗普、奥巴马和希拉里三小我的声音睁开一段对话。

　　让声音听起来更天然，是计算机法式在将笔墨转换针言音过程中面对的焦点挑衅，纵然今朝最好的语音助手，如苹果公司的青海网站扶植问答 Siri和亚马逊公司的Alexa，一发声给人的第一觉得仍然是，“哇！这是计算机。”背后缘故在于这些语音助手体系的事情原理：凭据预录的声音文档整顿出词汇，再通过另一个新的音频文档将这些词汇拼集在一路发声。

　　而琴鸟公司的AI使用了一种全新的语音合成体系，能在“倾听”过程中“控制”每小我措辞时字母、音位和单词的发音特点，通过推理并仿照这小我声音中的情感和语调，“说”出全新的语句。

　　新体系使用仿照人脑思维的算法建立出一种人工神经收集，能行使深度进修手艺将所西宁网站扶植问答听到的转换针言音，并仅靠任何人1分钟讲话内容，就能完全仿照这小我措辞。其市场远景异常广阔，可用来改善小我人工智能助手、音频册本以及残疾人语音体系等。

　　开发该体系的蒙特利尔大学进修算法试验室博士后亚历山大·布瑞比森透露，在学会并仿照了几小我的声音后，再仿照任何一个新工具的语音就会变得更快，是以新语音体系不需太多信息，1分钟足以捕捉某小我声音的焦点特点。

　　但美国卡内基梅隆大学语言手艺研究所传授迪莫·鲍曼透露，琴鸟的语音体系和真正的人声之间还有差距。“我细致听过琴鸟体系的发声，其带有配景噪音，以及薄弱的呆板人特性。并且，它还不克仿照人们在讲话中的呼吸和唇部活动，是以仍然能听出其计算机语音特性。”鲍曼说。他以为，语音体系真正令人信服地复制人声，还需再等几年。

　　总编纂圈点

　　人类的嗓音最美好，天籁之音怎能被呆板仿照出来？一呼一吸间的顿挫抑扬，一颦一笑间的情感升沉，才是人之为人的精髓地点。固然呆板仿照人声还差能人意，但仍大有效武之地——高德舆图林志玲版，不便是呆板通过进修特殊语料后，仿照奇特人声在给司机指路嘛。但需知，语音合成只是人工智能的一个根蒂条理，要想到达以假乱真乃至人机交互，估量还得一二十年。

本站所有文章,如需转载,请注明:转自西宁网络公司[http://www.xc28.cn]
原文地址:http://www.xc28.cn/show/781/

上一篇：英国谢菲尔德大学首次在华招收3D打印方向硕士博士下一篇：我国地球深部找矿突破4000米胶东地区成为世界第三大金矿区

“倾听”1分钟，就能开口模仿人类“讲话” 新款人工智能语音系统高效率复制人声

西宁科技资讯相关文章

西宁网络

青海西宁

青海网络

联系我们