导语声音本来就是最天然的嵌入式方式,但在之前漫长的时间里面,受限于语音辨识,人工智能网络宽带等因素,并没沦为主流。但从2017年开始,AI、语音辨识、网路应用于、移动APP,这几样早已发展成熟期,万事俱备,语音智能的应用于正好趁着东风很快发展一起,而且智能音箱表面看或许只是一款音箱,但实质上有更加战略性的起到,也就是说实质上是智能家庭的入口。
借助物联网技术,智能音箱实质上沦为了智能家庭相连互联网的网关,是家庭互联网交互的人机界面,于是以因为如此,我们可以看见完全所有的互联网巨头都不遗余力的发展自己的智能音箱产品,因为谁守住了智能家庭的入口,谁就可以做到先机,在此基础上布置本公司的家电产品生态链。本文将通过报废市面上早已有的一些产品来分析,然后对于语音子系统不会有一个详尽的案例。
智能音箱产品系统包含及工作中的信息流动首先智能音箱区别于传统的AI产品。它不是一个孤立无援的不存在,它们实质是一个互联网的智能终端。
再行通过麦克风阵列时刻收集语音,然后对语音展开减震等加工,然后做到关键字辨识,例如:homepadHisiri或者“天猫精灵”,“小爱同学”之类的关键词,一旦辨识关键词之后,就不会对后面收集到的语音数据展开传输编码,通过互联网传遍云端,云端的AI服务器具备强劲的运算能力,对语音指令展开辨识,然后根据指令来做到适当的恢复,例如传到语音恢复,传到一首歌的流媒体数据,或者传到对家中联网的物联网终端的掌控,例如电源空调等动作。智能音箱接到媒体流数据后展开解码驱动,扬声器播出语音恢复,接到家电控制指令后通过WIFI,BT来发送到被掌控的家电。所以这个工作的数据流还是很明晰的。在产品架构上面,首先,这是一台嵌入式电脑,因为牵涉到到减震等算法,以及流媒体编解码和播出功能,一般来说有一颗运算能力非常强大的处理器内核,目前主流的ARM架构是四核或者八核的CORTEX-A7处理器,浮点的运算能力强大,以及1G以上的ARM空间,外部配上8G的EMMC或者NANDFLASH等存储器外设,用作存储应用于的数据。
外围则有两个主要的子系统,一个是语音处置子系统,一个是无线通信子系统。无线通信子系统,辅助WIFI和BT通信,通过WIFI相连到无线AP和云端,或者在没公网的情况下和无线局域网中的其他智能家电通过WIFI来交互。WIFI通信的吞吐量大,可以传大流量的流媒体数据是智能音箱的联网基础。蓝牙这一部分一般来说通过经典蓝牙作为手机和外设交互数据,通过BLEMESH或者传统的BLE一拖多的方式和家庭网关的其他智能设备交互。
可以意识到未来无限通信部分还有可能引进ZIGBEE模式作为网关来相连ZIGBEE灯之类的智能家居产品。语音子系统,又分成输出和输入两块,输出一般来说是一个麦克风阵列,用作掉落声音数据,输入一般来说是IIS/PCM模块的音频CODEC芯片,通过音频功效展开功率放大后驱动一个4欧、8欧尺寸扬声器,当然语音和机械结构高度涉及,因此除了电子部分外,音腔的设备,麦克风的方位,阵列结构也是很最重要的。
除了内核,无线,语音三个主要板块外,还有一些其他辅助性的外设,比如LED灯,命令和背景灯,8D卡存储,USB模块以及电池和电源管理系统。在声学结构上面,在设计的时候要留意麦克风和扬声器的结构设计。
对于麦克风:1)人声能往返每个麦克,防止遮蔽效应,即产品长时间用于场景下,确保声源的直达声(非光线声)抵达每个麦克的机会是平均分配的,举例,麦克风震膜背向人的嘴巴就可能会构成遮蔽效应;2)声音抵达麦克风的路径尽量较短、长,拒绝谐振点频率在8KHz以上。对于伸展面壳加装方式,拒绝声孔的深度(面壳进声孔外侧到MIC进声孔外侧的距离)大于1.5mm,声孔直径尽量大(大于2mm)。
如果麦克能必要在表面最差;3)声音路径内不要不存在任何空腔,对于伸展面壳加装方式,震膜和壳体内壁不要有缝隙;4)麦克风要靠近阻碍或震动(喇叭震动、结构旋转震动)。对于震动,一般使用硅胶套展开隔热密封处置,硅胶硬硬度可根据实际结构形式展开给定检验,一般拒绝尽量硬;5)对于驻极体麦克风,结构设计和生产过程中要考虑到对麦克风的维护,防止断裂引起的麦克风一致性损失;对于扬声器:1)喇叭的杂讯要小,100Hz-1kHz杂讯要大于10%,1kHz之后大于5%。
一般喇叭在低频部分杂讯不会较高,多达10%,建议特滤波器杂讯低频成份。2)喇叭的结构设计要防止结构引起的杂讯,喇叭要展开隔热处置,防止结构震动对麦克导致较小影响。
3)喇叭腔体四周与其它机构件最少保有1mm的间距,振膜上方与机构件最少保有1.5mm的间隙,避免喇叭遇到结构件产生振动和异音。4)防止结构内声音传播,即喇叭的声音无法在结构内泄漏到麦克,不能通过结构外的空气传播到麦克,建议喇叭和麦克风放到有所不同腔体内或搭配性能好的密封材料对腔体内麦克部分展开密封;语音子系统的框架结构如下图右图:目前在开源硬件领域,有一些十分具备参考价值的构建,比如Respeaker就是一个标明的智能语音系统的开源构建。Resepeker2-MICArray这款麦克风阵列用于WM8960作为codec。Resepeker4-MICArray芯智资AC108高性能四地下通道数据转换器ADC,主要应用于智能语音远场麦克风阵列拾音,最少可级联16路麦克风。
本文来源:万博app|官方网站IOS/安卓通用版/手机APP,官网-www.wingcoo.com