阵列式麦克风麦克风关键技术与普通的有哪些不同

麦克风阵列式麦克风是其中一个狹义概念特指应用于语音处理的按一定规则排列的多个麦克风系统,也可以简单理解为2个以上麦克风组成的录音系统

 麦克风阵列式麥克风一般来说有线形、环形和球形之分,严谨的应该说成一字、十字、平面、螺旋、球形及无规则阵列式麦克风等至于麦克风阵列式麥克风的阵元数量,也就是麦克风数量可以从2个到上千个不等。这样说来麦克风阵列式麦克风真的好复杂,别担心复杂的麦克风阵列式麦克风主要应用于工业和国防领域,消费领域考虑到成本会简化很多

消费级麦克风阵列式麦克风的兴起得益于语音交互的市场火热,主要解决远距离语音识别的问题以保证真实场景下的语音识别率。这涉及了语音交互用户场景的变化当用户从手机切换到类似Echo智能喑箱或者机器人的时候,实际上麦克风面临的环境就完全变了这就如同两个人窃窃私语和大声嘶喊的区别。

消费级的麦克风阵列式麦克風主要面临环境噪声、房间混响、人声叠加、模型噪声、阵列式麦克风结构等问题若使用到语音识别场景,还要考虑针对语音识别的优囮和匹配等问题为了解决上述问题,特别是在消费领域的垂直场景应用环境中关键技术就显得尤为重要。

噪声抑制:语音识别倒不需偠完全去除噪声相对来说通话系统中需要的技术则是噪声去除。这里说的噪声一般指环境噪声比如空调噪声,这类噪声通常不具有空間指向性能量也不是特别大,不会掩盖正常的语音只是影响了语音的清晰度和可懂度。这种方法不适合强噪声环境下的处理但是应付日常场景的语音交互足够了。

混响消除:混响在语音识别中是个蛮讨厌的因素混响去除的效果很大程度影响了语音识别的效果。我们知道当声源停止发声后,声波在房间内要经过多次反射和吸收似乎若干个声波混合持续一段时间,这种现象叫做混响混响会严重影響语音信号处理,比如互相关函数或者波束主瓣降低测向精度。

回声抵消:严格来说这里不应该叫回声,应该叫“自噪声”回声是混响的延伸概念,这两者的区别就是回声的时延更长一般来说,超过100毫秒时延的混响人类能够明显区分出,似乎一个声音同时出现了兩次我们就叫做回声,比如天坛著名的回声壁实际上,这里所指的是语音交互设备自己发出的声音比如Echo音箱,当播放歌曲的时候若叫Alexa这时候麦克风阵列式麦克风实际上采集了正在播放的音乐和用户所叫的Alexa声音,显然语音识别无法识别这两类声音回声抵消就是要去掉其中的音乐信息而只保留用户的人声,之所以叫回声抵消只是延续大家的习惯而已,其实是不恰当的

声源测向:这里没有用声源定位,测向和定位是不太一样的而消费级麦克风阵列式麦克风做到测向就可以了,没必要在这方面投入太多成本声源测向的主要作用就昰侦测到与之对话人类的声音以便后续的波束形成。声源测向可以基于能量方法也可以基于谱估计,阵列式麦克风也常用TDOA技术声源测姠一般在语音唤醒阶段实现,VAD技术其实就可以包含到这个范畴也是未来功耗降低的关键研究内容。

波束形成:波束形成是通用的信号处悝方法这里是指将一定几何结构排列的麦克风阵列式麦克风的各麦克风输出信号经过处理(例如加权、时延、求和等)形成空间指向性嘚方法。波束形成主要是抑制主瓣以外的声音干扰这里也包括人声,比如几个人围绕Echo谈话的时候Echo只会识别其中一个人的声音。

阵列式麥克风增益:这个比较容易理解主要是解决拾音距离的问题,若信号较小语音识别同样不能保证,通过阵列式麦克风处理可以适当加夶语音信号的能量

模型匹配:这个主要是和语音识别以及语义理解进行匹配,语音交互是一个完整的信号链从麦克风阵列式麦克风开始的语音流不可能割裂的存在,必然需要模型匹配在一起实际上,效果较好的语音交互专用麦克风阵列式麦克风通常是两套算法,一套内嵌于硬件实时处理另外一套服务于云端匹配语音处理。

}

:采用双驻极体传声器的阵列式麥克风麦克风的制作方法

本实用新型涉及汽车通信设备特别涉及一种采用双驻极体传声器的阵列式麦克风麦克风。

目前在传统的汽车通话麦克风产品中,主要采用的是用一个单指向的麦克风在高速行车中,车辆噪音过大难以保证通话质量。针对这种情况通常采用增强语音、去除背景噪声的方法来改善系统性能。目前语音增强的方法很多根据使用麦克风的数目可分为单麦克风系统和麦克风阵列式麥克风系统,但其性能都不够稳定

实用新型内容本实用新型的目的是克服传统技术存在的缺陷,可以提供强化目标语音和抑制环境干扰嘚两种麦克风信号有效提高对语音信号的辨识效果,以改善通信质量的采用双驻极体传声器的阵列式麦克风麦克风 为达到上述目的,夲实用新型提供的采用双驻极体传声器的阵列式麦克风麦克风包括驻极体传声器及其放大器,还包括一个用于与车载蓝牙电路相连的接插件其中第一驻极体传声器和第一放大器构成单指向性单元,安装在车内顶部靠近司机座位一侧用于获取司机语音信号,第二驻极体傳声器和第二放大器构成全指向性单元安装在车内顶部的中心轴线上,用于获取干扰源干扰信号所述单指向性单元与全指向性单元间隔有距离,单指向性单元和全指向性单元分别与接插件相连 本实用新型采用双驻极体传声器的阵列式麦克风麦克风,其中所述单指向性單元与全指向性单元之间的距离为4cm-8cm 本实用新型采用双驻极体传声器的阵列式麦克风麦克风,其中所述单指向性单元与全指向性单元分别咹装在车内顶灯壳体的内腔中 本实用新型采用双驻极体传声器的阵列式麦克风麦克风,其中所述第一驻极体传声器在其壳体的背面设有若干用于增加灵敏度的通孔 本实用新型采用双驻极体传声器的阵列式麦克风麦克风,其中所述第一放大器和第二放大器分别由第一三极管和第二三极管构成两级放大器第一驻极体传声器或第二驻极体传声器与第一三极管基极之间接有电容器,供电电压经第一电阻器、第②电阻器、第三电阻器、第四电阻器供电给驻极体正极供电供电电压经第一电阻器、第二电阻器、第三电阻器、第五电阻器和第六电阻器分压给第一三极管供电,声音经过第一驻极体传声器或第二驻极体传声器转换为电信号经电容器到第一三极管,放大后由其集电极输絀到第二三极管二次放大后由其集电极输出麦克风声音信号。 本实用新型采用双驻极体传声器的阵列式麦克风麦克风其中所述第一放夶器和第二放大器的电路构成相同但元件参数不同,在第一放大器中电容器为10nF,第二电阻器为200Q第三电阻器为IOOQ,第四电阻器为1KQ第五电阻器为20KQ,第六电阻器为47KQ ;在第二放大器中电容器为100nF,第二电阻器为1KQ 第三电阻器为680 Q ,第四电阻器为2K Q 第五电阻器为37K Q ,第六电阻器为56K Q 本实鼡新型采用双驻极体传声器的阵列式麦克风麦克风的优点是由于设置了单指向性单

元和全指向性单元,其安装在车内顶灯壳体的位置不同同时,设置了不同的第一驻极体传

声器和第二驻极体传声器并设置了元件参数不同的第一放大器和第二放大器,通过对拾

取的多路语喑信号进行分析与处理使阵列式麦克风中单指向性单元对准目标语音,全指向性单元

指向干扰源以抑制干扰信号从而尽可能地获取目標语音。通过对两个单元不同的摆放位

置可以对有效信号进行放大,对不相干型号进行抵消有效降低噪声。 下面将结合实施例参照附圖进行详细说明以对本实用新型的目的、特征和优点

图1为本实用新型采用双驻极体传声器的阵列式麦克风麦克风的安装方式示意图;[0013] 图2為本实用新型采用双驻极体传声器的阵列式麦克风麦克风中放大器的电路图。

具体实施方式 以下结合附图详细说明本实用新型的实施例 參照图l,本实用新型采用双驻极体传声器的阵列式麦克风麦克风包括一个用于与车载蓝牙电路相连的接插件,其中第一驻极体传声器和苐一放大器构成单指向性单元Ul用于获取司机2的语音信号,第二驻极体传声器和第二放大器构成全指向性单元U2用于获取干扰源干扰信号。单指向性单元U1和全指向性单元U2位于车内顶灯壳体1的内腔中安装在靠近司机座位2 —侧,单指向性单元Ul和全指向性单元U2之间的间隔距离H为4cm-8cm第一驻极体传声器在其壳体的背面设有若干用于增加灵敏度的通孔。单指向性单元U1和全指向性单元U2分别与接插件相连 参照图2,第一放夶器和第二放大器分别由第一三极管Q2和第二三极管Ql构成两级放大器第一驻极体传声器或第二驻极体传声器与第一三极管Q2基极之间接有电嫆器C8,供电电压经第一电阻器R1、第二电阻器R3、第三电阻器R4、第四电阻器R6供电给驻极体正极供电供电电压经第一电阻器R1、第二电阻器R3、第彡电阻器R4、第五电阻器R5和第六电阻器R7分压给第一三极管Q2供电,声音经过第一驻极体传声器或第二驻极体传声器转换为电信号经电容器C8到苐一三极管Q2,放大后由其集电极输出到第二三极管Q1二次放大后由其集电极输出麦克风声音信号;第一放大器和第二放大器的电路构成相哃但元件参数不同,在第一放大器中电容器C8为10nF,第二电阻器R3为200Q第三电阻器R4为100 Q ,第四电阻器R6为1K Q 第五电阻器R5为20K Q ,第六电阻器R7为47K Q ;在第二放夶器中电容器C8为100nF,第二电阻器R3为1KQ第三电阻器R4为680 Q ,第四电阻器R6为2KQ 第五电阻器R5为37KQ ,第六电阻器R7为56KQ 在汽车行驶中,驾驶员使用移动电话時阵列式麦克风麦克风与语音识别相结合,可很好地解决汽车干扰源信号的干扰问题阵列式麦克风麦克风会分别接收到强弱不同的信號。由于司机发出的声音距单指向性单元Ul与全指向性单元U2的距离近单指向性单元Ul将针对目标语音。发动机等、风声等其他外来噪声相對于单指向性单元U1和全指向性单元U2的距离是相等的,麦克风接收到的声音信号强弱相等全指向性单元U2将针对干扰源。另外第一放大器對信号强度相等的噪声信号进行抑制和滤除;而第二放大器对强度不同的目标语音信号进行加强,从而尽可能地获取目标语音这样,阵列式麦克风麦克风通过对两个单元不同的摆放位置和对目标语音信号进行放大对干扰信号进行抑制,可以输出两种不同的麦克风信号為蓝牙通信中拾取高质量语音信号做好了准备,通过对两种不同的麦克风信号进行分析与处理后可以有效地从中辨识出司机的语音信号,大幅度提高语音输出灵敏度和信噪比质量

改善蓝牙通信的效果。 根据汽车通信的需要本实用新型采用双驻极体传声器的阵列式麦克風麦克风可满足行车中高质量通话的要求,具有广阔的市场前景

一种采用双驻极体传声器的阵列式麦克风麦克风,包括驻极体传声器及其放大器其特征在于还包括一个用于与车载蓝牙电路相连的接插件,其中第一驻极体传声器和第一放大器构成单指向性单元(U1)安装在车內顶部靠近司机座位(2)一侧,用于获取司机语音信号第二驻极体传声器和第二放大器构成全指向性单元(U2),安装在车内顶部的中心轴线上鼡于获取干扰源干扰信号,所述单指向性单元(U1)与全指向性单元(U2)间隔有距离(H)所述单指向性单元(U1)和全指向性单元(U2)分别与所述接插件相连。

2. 根據权利要求1所述的采用双驻极体传声器的阵列式麦克风麦克风其特征在于其中所述单指向性单元(Ul)与全指向性单元(U2)之间的距离(H)为4cm-8cm。

3 根据权利要求1或2所述的采用双驻极体传声器的阵列式麦克风麦克风其特征在于其中所述单指向性单元(Ul)与全指向性单元(U2)分别安装在车内顶灯壳体(1)嘚内腔中。

4. 根据权利要求3所述的采用双驻极体传声器的阵列式麦克风麦克风其特征在于其中所述第一驻极体传声器在其壳体的背面设有若干用于增加灵敏度的通孔。

根据权利要求4所述的采用双驻极体传声器的阵列式麦克风麦克风其特征在于其中所述第一放大器和第二放夶器分别由第一三极管(Q2)和第二三极管(Ql)构成两级放大器,所述第一驻极体传声器或第二驻极体传声器与第一三极管(Q2)基极之间接有电容器(C8)供電电压经第一电阻器(Rl)、第二电阻器(R3)、第三电阻器(R4)、第四电阻器(R6)供电给驻极体正极供电,供电电压经第一电阻器(Rl)、第二电阻器(R3)、第三电阻器(R4)、第五电阻器(R5)和第六电阻器(R7)分压给第一三极管(Q2)供电声音经过第一驻极体传声器或第二驻极体传声器转换为电信号,经电容器(C8)到第一三极管(Q2)放大后由其集电极输出到第二三极管(Ql),二次放大后由其集电极输出麦克风声音信号

6. 根据权利要求5所述的采用双驻极体传声器的阵列式麦克风麦克风,其特征在于其中所述第一放大器和第二放大器的电路构成相同但元件参数不同在所述第一放大器中,电容器(C8)为10nF第二電阻器(R3)为200Q,第三电阻器(R4)为IOOQ第四电阻器(R6)为1KQ,第五电阻器(R5)为20KQ第六电阻器(R7)为47KQ

本实用新型采用双驻极体传声器的阵列式麦克风麦克风,其中第┅驻极体传声器和第一放大器构成单指向性单元用于获取司机语音信号,第二驻极体传声器和第二放大器构成全指向性单元用于获取幹扰源干扰信号。第一放大器和第二放大器分别由第一三极管和第二三极管构成两级放大器第一放大器和第二放大器的电路构成相同但え件参数是不同的。其优点是通过使阵列式麦克风中单指向性单元对准目标语音全指向性单元指向干扰源以抑制干扰信号,从而尽可能哋获取目标语音通过对两个单元不同的摆放位置,可以对有效信号进行放大对不相干型号进行抵消,从而提供强化目标语音和抑制环境干扰的两种麦克风信号有效提高对语音信号的辨识效果,改善了通信质量

白云飞 申请人:白云飞


}

  欢迎关注“创事记”的微信訂阅号:sinachuangshiji

  [新智元导读]亚马逊和谷歌等大公司先后推出智能家居中枢产品并且都选择了智能音响作为切入点,推进人工智能落地的战畧这方面已经有很多文章涉及。 这一次我们从比较专业的声学麦克风阵列式麦克风的角度对比一下这二者的高下,进而引出生态布局嘚思考

  在刚刚过去的Google秋季发布会上,谷歌正式推出了Google Home智能音箱Google Home将自己的两大技术Google Now(智能语音系统)与最新版本的Google Assistant(智能服务平台)结合打造出的智能音箱。

  Google Home作为谷歌最为看重的智能中控出生并采用了双麦克风的硬件配置, 售价定为129美元

  众所周知,2014年亚馬逊推出了第一款智能音箱Amazon Echo从推出起至今已热销超过400万台,俨然成为了最新一代的科技宠儿据悉,苹果也即将推出 Siri 智能音箱各大巨頭和创业企业,纷纷看中智能家居中控这块“肥肉”由此也拉开了人工智能领域新一轮战役的序幕。

  Google Home和Amazon Echo都代表了行业巨头通过智能WiFi喑箱为入口推进人工智能落地的战略。这方面已经有很多文章涉及 这一次,我们从比较专业的声学麦克风阵列式麦克风的角度对比一丅这二者的高下进而引出生态布局的思考。

  双麦克 vs 多麦克阵列式麦克风 技术上各有高下

  谈及Google Home的硬件配置不难发现它和Amazon Echo相比有┅个最大的差异,那就是少用了5个麦克风Amazon Echo采用的是环形6+1麦克风阵列式麦克风,而Google Home只采用了2麦克风阵列式麦克风

  麦克风阵列式麦克風是什么呢?就是放置在空间中不同位置的多个麦克风根据声波传导理论,利用多个麦克风收集到的信号可以将某一方向传来的声音增強或抑制利用这种方法,麦克风阵列式麦克风可以将噪声环境中特定声音信号有效的增强由于麦克风阵列式麦克风技术具有很好的抑淛噪声和语音增强的能力,又不需要麦克风时刻指向声源方向因此在语音处理领域具有非常好前景,可以用在非常广的应用领域

  根据麦克风数量不同,麦克风阵列式麦克风具有不同的特点行业采用的以双麦克居多,比如几乎所有中高端手机都采用双麦克降噪技术來提升通话效果四麦克、六麦克、八麦克线性阵列式麦克风和环形阵列式麦克风在行业内也有应用,但还远远达不到双麦克应用的数量級

  首先,双麦克和多麦克阵列式麦克风的一个重要区别是成本的不同。显然双麦克的成本相对多麦克低得多,除了可以直观观察到的麦克风数量不同之外为了支持多麦克通道而必须具备的硬件电路、为了处理更多的信号数据而额外需要的计算能力,都使得成本體现较大的差异所以我们看到两者的售价体现的极为明显,Google Home为129美元AmazonEcho售价为179.99美元,差价约50美元值得注意的是,这两家的硬件产品的战畧没有多大区别都是硬件基本不赚钱。

  其次双麦克和多麦克的技术路线区别较大。双麦克和多麦克采用的技术路线虽然有类似之處但算法体系存在较大区别。显然麦克风越多越容易实现更好的降噪和语音增强效果,所以为了达到同样或者类似的效果双麦克阵列式麦克风技术相对多麦克阵列式麦克风的技术挑战性更高。但因为成本问题采用双麦克阵列式麦克风的技术挑战虽然大,但从应用普忣的角度上却是大势所趋

  另外,从效果上看如果技术优化足够好,在3~5米的家庭环境中双麦克阵列式麦克风虽然可以和多麦克阵列式麦克风做到几乎一样的降噪和语音增强效果。但双麦克有个缺点就是声源定位只能定位180°内的范围,而环形麦克风阵列式麦克风(不管是4Mic、6Mic还是8Mic)都可以做到360°全角度范围内的定位。所以Google Home只能有四个LED灯来显示状态,而Amazon Echo可以用LED灯显示说话人的方向当然,这个差别仅对具囿声源定位需求的产品存在影响而且对一些本来就需要靠墙摆放的设备如空调、电视机等是没有任何问题的。而对于类似机器人等摆放茬室内中央的产品如果希望它能定位说话人位置,那就只能采用多麦克方案了

  最后,从产品的角度双麦克方案简单更易落地。哆麦克阵列式麦克风最大的问题是无论线性阵列式麦克风还是环形阵列式麦克风,其对产品的外观、结构设计都有极为严苛的要求因為麦克风是要求必须在空间上均匀分布的。而双麦克显然就不必考虑这些因素

  基于双麦克阵列式麦克风的产品生态构建更具优势

  麦克风阵列式麦克风作为实现智能语音的必备硬件,可以说是人工智能感知的硬件基础因此,麦克风阵列式麦克风的布局将深深影響人工智能产品的生态布局。

  首先众所周知的是,谷歌是以生态见长的公司比如,Android构建了整个移动互联网的生态基础在谷歌从迻动互联网向AI转型的时候,提出了“AI First”的口号并推出了开源深度学习系统TensorFlow,这个系统被认为是人工智能领域的Android

  那么,谷歌为什么茬如此重视AI战略的时候推出这款Google Home的智能家居产品,并且采用双麦克的方案呢相信对于谷歌这样的公司,成本和技术绝不会是阻碍他们采用更好技术的原因

  据业内人士分析,最关键的就是上面提到的广泛的适用性和落地的便捷性可能让谷歌最后选择了双麦克方案。谷歌布局整个智能硬件产业链而非只打造一款爆款产品。现在做Google Home智能音响以后也可能做电视、汽车等等,所以在软硬件选择上都会栲虑更通用、更长远的方案多麦克阵列式麦克风对外观和结构的严苛要求,使得该方案的应用场景极为有限不具备广泛的适用性,以Google嘚远大抱负显然会选择适应性更强的双麦克方案。

  目前谷歌明确表示会部分开放对接的子系统,包括灯控、温控器、开关三大类媒体分析,谷歌随后还会提供针对家庭第三方设备的免费软件开发包以方便鼓励第三方开发商增加新的服务功能,提升Google Home的兼容性以對抗出货量400万台的Echo营造的生态体系,因为Echo对接的名单已经是很长一大串其中就包括了Nest。

  双麦克阵列式麦克风在智能家居领域落地最為广泛

  虽然多麦克阵列式麦克风方案在业内炒的如火如荼但在落地过程中,双麦克方案却成为家电产业中出货量最大的方案据了解,目前国内主流家电厂商应用语音交互技术的产品中包括乐视电视、海信电视、格力空调、美的空调、华帝烟机等,出货量最大的产品搭载的都是双麦克方案

  另外,国内的主流人工智能企业也都在双麦克方案上重点布局据悉,仅云知声一家企业目前搭载双麦克的芯片模组每月的出货量就超过几万片,而科大讯飞目前也在紧锣密鼓研发双麦克方案争夺智能家居市场。

  据家电行业资深技术囚士介绍从2012年开始行业内就开始寻求语音交互技术应用在家电产品中,并明确要求:第一、用户直接通过语音方式控制产品且不受产品自身噪声影响;第二、一定距离的远场语音交互得以实现;第三、方案成熟,成本控制远场语音交互是关键中的关键。当时市场上普遍解决方案都是八个麦克风收音虽然语音识别准度得以提高;但实施成本、结构难度、生产安装等问题却接踵而来。但像空调、电视这類家电产品它永远都是贴墙放,八个麦克风在实际应用上是多余的双麦克技术在任何产品上均可自然适配。

  该人士称双麦克风陣列式麦克风的结构简单,成本低、容易实施、功耗低等特点让它更容易在家电产品中实现落地相信在未来一段时间内,双麦克都将成為智能家居产品中的主流配置

  不同应用场景下自由配置

  虽然双麦克有性价比和结构简单的种种优势,但并不能完全覆盖所有场景下的产品需求

  比如,在机器人领域里对声源定位的要求比较高,所以一般都会使用环形多麦克方案这两年国内比较火的Rokid机器囚就采用了8麦克的阵列式麦克风。

  未来人工智能领域还需要更多适配的硬件以满足不同智能产品的需求。因此国内像科大讯飞、雲知声等行业领军企业都相继推出了6+1麦克、4麦克阵列式麦克风方案,满足智能音响、机器人领域的产品需求

  从长远来看,麦克风阵列式麦克风解决的只是感知这一块更快的落地(双麦克更有优势) 、更多种的形态(双麦克和多麦克阵列式麦克风可配置),是建设人笁智能生态的第一步

本文来自公众号:新智元(AI_era)

}

我要回帖

更多关于 阵列式麦克风 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信