白皮书-如何使用WoS麦克风

1,介绍

1.1 一直开启的声控(几乎是)无处不在

一直工作的麦克风用于语音控制已经是电脑,手机和家庭自动化中心的标准功能。语音控制不需要一个屏幕,物理的接触或用户的全神贯注,唯一的传感器就是一个麦克风或者麦克风阵列。板上的处理器必须能够识别一个唤醒字(亚马逊的ALEXA,苹果的SIRI,谷歌的OK GOOGLE或微软的CORFANA等) 但是以后的语音识别可以放在云端。显然,这是一个理想的办法来和无处不在的,不引入注目的,互联的设备进行互动。

但是这种方案几乎没有,为何?

直到现在,一直开启麦克风的待机功耗受产品限制,需要频繁充电。麦克风和语音处理器一直警觉的,一直在等待唤醒字一甚至在没有声音听到情况下,或是一个恒定的,不出众的底噪。

这样做是浪费的。相比之下,一个移动应用处理器耗少许电,当任务出现则加速运转,然后又回来进入睡眠状态。我们如何才能将此范例引入到常开的语音处理器呢?我们如何才能在没有价值的内容的情况下将它们进入睡眠呢?

1.2,介绍声音唤醒:

此应用手册介绍了如何使用VESPER的VM1010概念验证麦克风,它有独特的功能叫做声音唤醒WoS。这个是早期原型产品,展示了声音唤醒概念的可行性

在全功耗模式,WoS麦克风的功耗是200uA,作为一个超可靠的单端输出麦克风. 就像所有的VESPER麦克风一样,它是防尘防水其等级可以达到IP68+的环境保护。

在WOS模式,麦克风的功耗只有6uA。模拟输出是关闭了的,但是麦克风仍旧在监测环境的声压级。假如一个听到的声音是超过(可调的)WOS响度门限,麦克风就提起一个数字输出脚。这个就可以做为语音处理器的唤醒信号,使处理器待命来录制和处理进来的声音。

WOS麦克风是一个可编程的,超低功耗的声学看门狗。在它保持警觉的时候,整个信号链:语音处理器,前置放大器,数据转换器都是在睡眠状态的。当声音到达的时候,系统就开始行动。

在很多应用中,WOS麦克风提供此能力来到达几乎为零的功耗。手机或移动音箱的电池通常在无负载的情况下消耗200uA(3000mAh的锂电是每月5%的自放电,也就是2%的泄漏加上3%的保护电路的功耗)。更小的智能手表的电池在无负载下是20uA的功耗。这个电池的自放电就理论上代表了一个产品的零功耗情况下的最大电池寿命。WoS麦克风的6uA电流只降级“零功耗”电池寿命的3%到23%。

VM1010应用举例包括:


a, 作为7/24语音控制系统的唯一的麦克风,用来唤醒语音处理器和作为一个普通录音麦克风提供一个模拟信号给语音DSP

b, 作为一个"声学看门狗"-唤醒语音处理器, 但是声音录制用其它麦克风阵列

c, 作为一个数字输出, 超低功耗的声学事件检测仪, 能够检测玻璃破碎, 小孩哭声和其它的大声压事件


2,脚位描述

Pin Number

Pin Name

Description

1

模式

模式控制 (高=WoS,低=全功率)

2

GA2

声音唤醒增益调整脚2

3

Vdd

供电 1.6~3.6V

4

GA1

声音唤醒增益调整脚1

5

Dout

数字输出用于WoS触发

6

Vout

模拟信号输出

7
GND
8
GND

3,麦克风模式

WoS麦克风取决于模式数字输入脚在两种模式之间切换。所有的数字脚使用标准的CMOS逻辑电平和vdd成比例。



图2:时序图显示了左边启动时间,过度时间到中间的WOS模式和右边的全功耗模式。

我们建议在全功耗(模式脚低)开启麦克风继而进入所需要的WOS模式

图3显示了模式脚和麦克风状态之间的关系。



图3:VM1010概念性麦克风的模块图

3.1全功耗模式(音频输出)

当模式脚拉低时,麦克风处于全功耗模式。它可以做为任何的单端硅麦,尽管其输入灵敏度是非标准的。

在全功耗模式,Vout的偏置是0.6v。在唤醒模式,Vout是接地的.假如Vout是AC耦合到一个缓冲器或ADC,在进入全功耗模式时,从地到0.6V的偏置切换能产生一个“爆破”音。用直流耦合则不会出现。

3.2唤醒模式(语音触发)

当模式脚高的时候,麦克风处于唤醒模式。

当刚开始进入WOS模式时,Dout脚是设置到逻辑低。假如麦克风信号超过WOS门限,Dout设成逻辑高。

设成高之后,Dout保持在高,直到麦克风离开唤醒模式。继而,门闩可以通过切换模式脚重置来离开和重新进入唤醒模式。

在唤醒模式,麦克风有一个250HZ到6KHZ的带通频响。这就减少了误触发来响应人声,而排斥了风噪,暖通空调声和其它环境信号。



唤醒的门限是通过GA1和GA2之间的阻抗来实现的。假如这些脚未连接(高阻),其门限值默认在85dBSPL。3.2.1和3.2.2章节描述了如何调整这门限。

3.2.1唤醒门限调整(固定的)

唤醒的门限默认在85 dBSPL,可以通过在GA1和GA2之间连接一个电阻来调整。如图7所示,这些脚在唤醒信号路径中提供了和仪表放大器的反馈网络的接口,GA1和GA2之间的电阻越小,仪表放大器的增益越大。WOS门限的结果基于下面的公式:

此公式对于最小门限为65 dBSPL有效,如图8所示。


如表4所示,GA1和GA2脚都可以容忍到地的最大负载电容是5PF,这就意味着从Rg到GA1和GA2的连线应越短越好。

3.2.2唤醒门限调整(可变的)

为了最大化功率节约,应使VM1010尽量处于WOS模式,只在听到语音指令的时候才进入全功率模式。假如是在一系列的环境噪声电平下使用,最好更新WOS门限到一直刚好高于环境噪声水平。

图9:可变的唤醒门限,用可切换的电阻群来实现。

图9显示了是如何来完成的。图7中的固定电阻用一对电阻,低电容的模拟开关来代替, 这就允许了三种不同的Rg值的接通。此例中,我们可以在高阻,148KΩ和36KΩ之间切换。这些阻值对应于可选的WOS门限85,75和65 dBSPL。

我们的例子中使用了TI的TS5A2066DCUR双模拟开关。注意这些电阻网络是差分的,用了两个18KΩ和56KΩ电阻,而不是一个36KΩ和112KΩ电阻。这就确保了模拟开关的电容是纯粹的共模模式,不会影响仪表放大器的差分增益。

4.系统架构

4.1 WOS的控制环路。



图10显示出了在WOS麦克风周围建立的全功能系统。当WOS麦克风被声音触发而唤醒系统且无声音需要处理时,DSP或语音处理器能保持在低功耗模式。

以下是可以建立在系统架构周边的控制环路的举例:

4.1.1.模式脚高,麦克风在WOS模式。语音处理器在低功耗模式,Dout设置成一个硬件的中断脚。

4.1.2.听到声音:Dout从低到高切换,就唤醒语音处理器。语音处理器降低模式脚来进入全功耗模式。

4.1.3.麦克风进入全功耗模式:其Vout就开启,发送模拟语音信号给ADC。语音处理器对于唤醒词来采集&分析这个音频,然后做适当的响应。

4.1.4.语音DSP继续响应声音直到环境变得安静。然后语音处理器拉高模式脚(将麦克风送回唤醒模式)且进入低功耗模式。

在一个安静的环境中,系统将花大部份的时间在步骤1,而语音处理器则处于低功耗模式,麦克风的功耗只有6uA。在大声的场景,语音处理器可以在GA1和GA2之间放置一个大电阻来提升WOS的门限使其高于环境噪声。

很多应用场合不需要此架构中的所有模块。这些包含:

1)ADC有内置预放

a,模拟缓冲器不需要了(Vout直接连到ADC)

2)WoS作为看门狗
a,
b,
c,

3)作为大声压声学检测器

4.2 VESPER的WOS概念验证板



我们设计了一个概念板,展示了WoS和立刻采集声学事件的可行性.

此板是基于飞思卡尔的FRDM-K22F平台.他是用来将VM1010保持在WoS模式,等待一个语音触发.一旦触发之后,此板立刻录制来自麦克风的第一秒的音频信号,然后回放录制的信号

此板并不执行语音识别,它展示了在第一个说话音节就唤醒的能力,然后采集剩下的说的是什么。

4.3设计注意:电源管理

为了获得最佳的工作,使用一个超低噪声的电源管理来提供1.8V给VDD当使用麦克风时。我们的概念验证板使用的是美信的MAX6070

4.4 设计注意:门限控制

为了设置WoS的门限,我们的概念板使用了4个电阻和来自TI的TS5A2066DCUR双模拟开关,这个和3.2.2章的门限调整电路是一样的

PDF下载 EN CN

相关阅读:什么是麦克风的噪声

Vesper麦克风防水防尘原理

应用以及优势:

1,手机
2,平板
3,耳机
4,汽车
5,运动相机
6,无人机
7,智能音箱
8,行车记录仪:解决温度车内过高麦克风灵敏度飘移;后座都可以远距离录音;提升语音识别率;震动灵敏度优于电容式ECM麦克风;
9,对讲机 :能在恶劣条件下比如烟雾,水,灰尘下长期使用;抗震动;耐大声压比如人的吼声和户外风声;
10,遥控器
11,玻璃破碎检测

料号清单:

VM1001
尺寸:3.35*2.5*1.0mm 模拟输出 68dB信噪比
VM1000 尺寸:3.76*2.95*1.11mm 模拟输出 65dB信噪比
VM2000 差分输出的麦克风,尺寸:3.76*2.95*1.1mm
VM1010 6uA用于always-on的麦克风

VesperMems样品&报价购买&技术&评估板 咨询代理商=>座机0755-82565851 邮件 dwin100@dwintech.com 手机156-2521-4151


首页home 产品product 新品发布news 参考设计ref.d 联系contact 应用笔记app note

D-Win Technology(HongKong) Co.,Ltd 深圳市南频科技有限公司