当前位置:网站首页 > 西宁科技资讯

“倾听”1分钟,就能开口模仿人类“讲话” 新款人工智能语音系统高效率复制人声

  原题目:“倾听”1分钟,就能启齿仿照人类“讲话”

  据《科学美国人》杂志网站2日报道,加拿大新创公司琴鸟(Lyrebird)发布了新款人工智能(AI)语音体系,其能通过度析讲话灌音和对应文本以及两者之间的关联,在1分钟内仿照人类“讲话”,好比,仿照特朗普、奥巴马和希拉里三小我的声音睁开一段对话。

  让声音听起来更天然,是计算机法式在将笔墨转换针言音过程中面对的焦点挑衅,纵然今朝最好的语音助手,如苹果公司的青海网站扶植问答 Siri和亚马逊公司的Alexa,一发声给人的第一觉得仍然是,“哇!这是计算机。”背后缘故在于这些语音助手体系的事情原理:凭据预录的声音文档整顿出词汇,再通过另一个新的音频文档将这些词汇拼集在一路发声。

  而琴鸟公司的AI使用了一种全新的语音合成体系,能在“倾听”过程中“控制”每小我措辞时字母、音位和单词的发音特点,通过推理并仿照这小我声音中的情感和语调,“说”出全新的语句。

  新体系使用仿照人脑思维的算法建立出一种人工神经收集,能行使深度进修手艺将所西宁网站扶植问答听到的转换针言音,并仅靠任何人1分钟讲话内容,就能完全仿照这小我措辞。其市场远景异常广阔,可用来改善小我人工智能助手、音频册本以及残疾人语音体系等。

  开发该体系的蒙特利尔大学进修算法试验室博士后亚历山大·布瑞比森透露,在学会并仿照了几小我的声音后,再仿照任何一个新工具的语音就会变得更快,是以新语音体系不需太多信息,1分钟足以捕捉某小我声音的焦点特点。

  但美国卡内基梅隆大学语言手艺研究所传授迪莫·鲍曼透露,琴鸟的语音体系和真正的人声之间还有差距。“我细致听过琴鸟体系的发声,其带有配景噪音,以及薄弱的呆板人特性。并且,它还不克仿照人们在讲话中的呼吸和唇部活动,是以仍然能听出其计算机语音特性。”鲍曼说。他以为,语音体系真正令人信服地复制人声,还需再等几年。

  总编纂圈点

  人类的嗓音最美好,天籁之音怎能被呆板仿照出来?一呼一吸间的顿挫抑扬,一颦一笑间的情感升沉,才是人之为人的精髓地点。固然呆板仿照人声还差能人意,但仍大有效武之地——高德舆图林志玲版,不便是呆板通过进修特殊语料后,仿照奇特人声在给司机指路嘛。但需知,语音合成只是人工智能的一个根蒂条理,要想到达以假乱真乃至人机交互,估量还得一二十年。


本站所有文章,如需转载,请注明:转自西宁网络公司[http://www.xc28.cn]
原文地址:http://www.xc28.cn/show/781/
上一篇:英国谢菲尔德大学首次在华招收3D打印方向硕士博士 下一篇:我国地球深部找矿突破4000米 胶东地区成为世界第三大金矿区

西宁科技资讯相关文章