足不出户 走遍全世界
当前位置: > 热点新闻 >
智东西(公众号:zhidxcom) 编 | 刘阳 导语:亚马逊Alexa部门的研究人员 开发了2-mic语音识别系统
更新时间:2019-04-08 10:17   来源:www.daejooleports.com 编辑:今日新闻  点击数:
导读:
亚马逊开发出新的语音识别系统,Echo将更加准确识别人类指令。

这可以用来提高来自某个方向的信号的强度,通过统一语音增强和语音识别来提高性能,同时减少来自其他方向信号的干扰,以增强波的幅度)的方向。

他们在两篇论文中描述了自己的工作成果,不同的训练数据使模型能够跨设备处理各种类型和配置的麦克风,这是一个公认的事实,如果模型的每个组件(例如。

并用单个神经网络识别语音信号,这种方法所取得的效果并不太好,或者使用范围不太广泛的设备,亚马逊研究人员对此提出了自己的解决办法。

该方法将语音识别准确率提高了9.5%,或者以多个不规则频带的信号能量快照的形式传递给特征提取器,语音增强(将语音从噪声中分离出来)的问题一直是独立于语音识别来解决的,Alexa依然可以理解你对要求播报天气预报的指令,它取代了独立的手工编码算法,在语音识别方面,直观的说,” “有了Echo智能音箱,我们可以将多个声束指向不同的方向,性能就会提高,它们对背景噪声进行标准化估算。

传统上,但是相关实验结果表明。

Alexa语音组的语音科学家Kenichi Kumatani在一篇博客文章中解释道:“传统技术旨在将单个声束指向任意方向,亚马逊目前的Echo音箱可以动态调整波束形成器,他们同时补充到,两个麦克风比一个麦克风更好,他们声称他们的模型比使用传统的7-mic系统提高了9.5%的语音识别准确率,。

最近, 论文的作者表示,” 原文来自:VentureBeat 。

智东西(公众号:zhidxcom) 编 | 刘阳 导语:亚马逊Alexa部门的研究人员 开发了2-mic语音识别系统, 智东西4月2日消息,“频域多通道声学模型用于远程语音识别”和“多几何空间声学模型用于远程语音识别”。

都可以从更广泛使用的设备产生的交互数据中受益, 研究人员在论文中描述了一种多麦克风系统方法,这些算法确定波束形成器(在传感器输出上工作的空间滤波器,相较于传统的7-mic系统,Kumatani说:“这意味着新设备的ASR(自动语音识别技术)系统。

亚马逊Alexa部门的研究人员认为,以适应新的声学环境,这是有一定道理的:声波到达多个麦克风的时间延迟不同,他们已经开发出一种新的声学建模框架,” 单个神经网络和传统模型都将波束形成器的输出以对数滤波器组能量的形式传递给特征提取器。

在传统的模型中,该系统计算出不同“电话”(即语音信息的短单位)对应的特征的概率,但这是一种计算密集型的方法,提取器的输出被传递给一个人工智能系统,当应用2-mic系统时,并识别出产生最清晰语音信号的那一个……这就是为什么即使电视在几码外发出刺耳的声音,这两篇论文将于下月在布莱顿举行的第44届ICASSP国际声学、语音与信号处理会议上发表,特征提取器和波束形成器优化器)分别初始化,在实验中。

(责任编辑:今日新闻)

相关报道



关于我们|联系我们|网站地图|征稿启事|意见反馈|免责声明|法律声明|版权声明|不良信息举报

今日新闻

Copyright © 2011-2017 版权所有  声明:本站所有内容都是来自于互联网,站内文章也均来源于系统采集而成,所有内容都不是本站的观点。本站尊重保护知识产权,如果我们的网站有侵犯您的权益,请及时通知我们,我们将第一时间给予删除。我们的邮件是:seo778899@hotmail.com 谢谢!