小爱智能音箱可以不喊小爱同学吗(小爱同学原理解析)

目前小米小爱同学的应用有智能音箱、小米电视、手机、小白摄像头、Yeelight等,小爱同学作为智能语音硬件交互的接口,让用户可以通过语音和产品进行交互。

小爱智能音箱可以不喊小爱同学吗(小爱同学原理解析)(1)

小爱智能音箱

那么当我们用问小爱同学天气的时候,或者让小爱同学播放刘德华的歌的时候,智能音箱的交互原理是怎么样的呢?本文为你分析一下。

麦克风阵列

麦克风阵列作为智能语音交互设备硬件第一关,麦克风阵列直接决定的产品的功能和性能

目前麦克风阵列方案有单麦方案,两麦线性阵列,四麦线性阵列,四麦环形阵列和六麦环形阵列,下图列出各方案的对比:

小爱智能音箱可以不喊小爱同学吗(小爱同学原理解析)(2)

麦克风方案对比

单麦方案一般应用于对交互要求不高的智能硬件,如语音遥控器,智能灯泡等,这种设备多是内置语音控制指令,由特定的指令词去控制。单麦的方案商有启英泰伦等。

小爱智能音箱可以不喊小爱同学吗(小爱同学原理解析)(3)

启英泰伦的单麦方案

两麦和四麦方案常见应用于智能音箱,智能机器人等,阿里的天猫方糖用的是两麦方案,小爱音箱mini,小度智能音箱用的是四麦方案。

两麦和四麦方案可以进行语义解析,动态噪声抑制比较高,相对于单麦方案,可利用多麦进行声源定位,环形麦克风阵列比线性的声源定位角度广,两麦和四麦方案商有科大讯飞、声智科技和XMOS等。

小爱智能音箱可以不喊小爱同学吗(小爱同学原理解析)(4)

环形六麦方案

六麦方案也广泛用于智能音箱,相对于四麦,六麦声源定位更准确,市场上的小米小爱音箱HD,天猫精灵,叮咚智能音箱都是采用六麦的方案,六麦方案商有科大讯飞、思必驰和XMOS等。

语音技能流程

小爱智能音箱可以不喊小爱同学吗(小爱同学原理解析)(5)

语音技能流程框图

举个例子,当我们用语音对小爱音箱mini呼唤“小爱同学”让它播刘德华的歌时,小爱音箱mini麦克风接收语音后,内部转化为文字后到小爱云上检索并解析,通过理解语料,调用第三方的语音服务,如QQ音乐提供的语音技能服务,然后将QQ音乐上刘德华的歌传输到小爱云,经过整合后通过小爱音箱mini播放出来。

小爱智能音箱可以不喊小爱同学吗(小爱同学原理解析)(6)

那什么时候用到内置语音服务呢?当我们命令音箱增加或减少音量,设定闹钟,换歌曲时,就需要调用内置的语音服务,内置的语音服务可以由设备提供。

上面的语音技能流程是众多智能语音音箱的通用流程,阿里的天猫精灵,百度的小度音箱也是同样的原理。

开发小爱语音服务流程

小爱智能音箱可以不喊小爱同学吗(小爱同学原理解析)(7)

开发小爱语音服务框图

小爱开放平台提供小爱语音服务的接入,目前支持的具有语音交互能力的智能设备有小米音箱,电视、故事机等。小爱同学语音服务目前在手机、电视、音箱、穿戴、智能家居车载设备等各类智能硬件设备及应用程序都有成熟的应用方案了。

小爱智能音箱可以不喊小爱同学吗(小爱同学原理解析)(8)

小爱开放平台

在小爱开放平台上开发技能或服务时,小爱同学语音服务接入方式有两种,分别是智能设备接入和应用程序接入。应用场景是根据已有成熟方案确定的,小爱平台为创作者提供NLU能力,设备厂商可以定制设备技能。技能确定后,小米的声学实验室将会帮开发者选的测试项进行声学测试。

小爱智能音箱可以不喊小爱同学吗(小爱同学原理解析)(9)

声学分析

小米声学实验室为开发者提供声学设计建议和声学测试与评估,辅助开发者的算法方案选型与开发。开发好的小爱技能自测后需要经过认证,对语音唤醒、语音识别、语义分析等众多语音技能服务进行功能评测和认证。

语音认证则尽可能覆盖各种声学场景,模拟用户真实的实用环境,保证硬件设备语音交互的整体质量。“小爱同学”的品牌可提高设备认可度。

所有的认证完成后,小爱技能才可以正式发布。至此,就可以通过呼唤小爱同学,实现小爱技能了。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页