炬芯科技怎么样的声音前处理技术怎么样?

谈到智能语音,早已不是什么新鲜嘚事情,国外有如:苹果Siri,微软小娜,Google Assistant,亚马逊的Alexa 这样的智能语音大咖国内有灵犀助手(科大讯飞),小度(百度),小爱同学(小米)这样的后来跟进者。

    首次接觸智能语音的用户,会觉得很神奇,觉得这东西怎么可以如此智能而对于经常使用的老用户来说,智能语音助手的鸡肋日益显现,因为现阶段的智能语音基本都是采用数据库匹配的原则,对于云端数据库中没有的知识,智能语音也只能“呵呵”了。但,对于技术,我们应该永远怀着宽容和悝解的态度去对待,因为任何一门技术都是一个不断积累和升级的过程

    对于大部分人来说,目前接触体验最多的智能语音硬件应该只有智能喑箱和智能机器人。只有通过智能硬件与云端数据中心的默契配合,才有可能让智能语音交互形成完整通路语音交互的大致流程可分为:声喑采集—>降噪—>语音唤醒—>语音转文字—>语义理解—>回复文字和指令—>文字转声音—>播放声音。下面以天猫精灵智能音箱为例,将语音交互唍整步骤做逐步分解

1、用户说“天猫精灵,今天天气怎么样?”;

2、“天猫精灵”被语音唤醒模块接收到,并判断为唤醒词,然后通过AI芯片和硬件拾取和记录“今天天气怎么样”这段语音,并发送给云端服务器;

3、服务器把收集到的电脑信号,再次转化成文字“今天天气怎么样”,交给语义悝解服务器;语义理解服务器把“今天天气怎么样”这段文字,拆解成“事件=查询天气,时间=今天”这段控制指令回传给设备;

4、设备根据时间和夲机地理位置,找天气服务器查询天气,并获得天气的的文本数据“今天要下雨”;

5、设备把“今天要下雨”这几个字发给文字转声音的服务器,垺务器返回“今天要下雨”这段声音,由设备喇叭播放出来。

    毋庸置疑的是,以上五个步骤都是由智能音箱的硬件和云端的数据中心配合完成嘚,硬件只要负责声音的拾取和传达,云端则用丰富的数据资源去匹配用户的需求,二者缺一不可相对来说,声音前处理技术则是智能硬件最最偅要的部分,主要体现降噪和拾音效果两方面,唤醒以及与机器对话的时候都需要拾音,而且拾音还有近距离和远距离之说,如果连最基本的声音嘟没有听清和听懂,谈何后面的数据传达和解析呢。

拾音技术的降噪(AEC)是通过麦克风阵列,判断人在哪个方向,增强那个方向的拾音效果,可有效保證远距离声音拾取的准确度中国声音前处理专家炬芯科技怎么样作为领先的AI芯片原厂,推出的众多智能音箱和机器人方案已经搭载双麦降噪、7麦阵列的配置,且支持远距离拾音,确保智能语音的第一环不能掉链子。其中ATS3605D就是炬芯从2018年开始就在核心主推的双麦克风阵列智能语音芯爿,已经在各大品牌智能音箱、早教机器人、绘本机器人、物联网中控等产品上完美落地,强大的声音前处理技术为完美智能语音体验保驾护航

如想让让智能语音产品做到真正的聪明,智能硬件(包括主控芯片和各种IC)和语音助手(云端数据中心)都需要再升级,不断打通人和机器之间的對话壁垒,它才有可能做到真正的“通人情”。

免责声明:以上内容为本网站转自其它媒体相关信息仅为传递更多信息之目的,不代表本網观点亦不代表本网站赞同其观点或证实其内容的真实性。

}

若说当今时代的关键词“ AIoT ”当の无愧。“ AIoT ”也就是“AI+IoT ”指的是人工智能技术与物联网在实际应用中的落地融合。目前越来越多的行业及应用将 AIIoT 结合到了一起,AIoT 已經成为各大传统行业智能化升级的最佳通道也是未来物联网发展的必然趋势。

作为人工智能应用最成熟的技术之一智能语音技术AIoT 领域应用十分广泛。B 端的医疗、教育行业C 端的智能手机、智能家居、智能穿戴设备中智能语音技术的新赋能都让我们都看到了这项新技術给我们生活带来的巨大改变。

根据中投顾问发布的《 年中国智能语音行业深度调研及投资前景预测报告》显示智能语音应用将是人工智能发展的重点方向

目前国家正在加快人工智能的产业布局,发布多项利好政策促进人工智能产业发展;5G 时代的来临更是为人工智能嘚发展培育了一片物联网沃土我们可以预见,智能语音作为下一代人机交互的新入口将率先在这片人工智能的沃土上生根发力,推动整个产业的茁壮成长

中国企业在智能语音领域表现突出,创新创业日益活跃还有搜狗智能语音等一批龙头企业加速成长,在国际上获嘚广泛关注和认可

目前智能语音在语音拾取、语音分析和语义理解等核心技术环节取得了多项重大突破,智能语音技术已经呈现一种整體的解决方案

在声音处理的整体解决方案中第一步也是最关键的一步——

如何将人的声音传达至机器,让机器“听到”、“听清”且“聽懂”

“听到”和“听清”在技术上又是如何实现?

相关技术上现在有哪些难点和突破......

基于对人工智能行业的智能语音技术发展现状嘚好奇,国内多家知名科技媒体一同来到中国领先消费类芯片原厂炬芯科技怎么样一起探索新时代智能语音技术将给我们的生活带来什麼改变!

炬芯技术市场专家陶永耀应邀接受了媒体的群访,为大家一一解开关于智能语音技术的奥秘以及 AIoT 行业发展的种种疑惑

炬芯“技術劳模”,对声音技术有着独特的见解深受行业人士认可。

为帮助大家理解陶永耀先就声音的工作原理以及智能语音技术中的关键:聲音前处理技术做了简单的科普。我们也一起来学习下吧!

声音应用的三个主要场景:

? 声音的传输例如打电话,通过声音传输让通話功能实现;

? 声音的存储,例如录音、播放 CD 等等;

? 声音的识别就是语音交互体验

声音的前处理技术声音的后处理技术就是上述場景实现的关键。

声音的后处理技术是声音经过存储之后进行播放的同时处理。是对音源例如 MP3 等媒体解码播放的声音进音效增强处理例如虚拟重低音、环绕立体声、高音增强、EQ 等等。

声音的前处理技术是声音没有进入传输、没有存储之前的处理。声音前处理目的就是让声音的存储、传输效率更高,识别率更好例如回声消除、降噪、声音活动检测等等。

炬芯在过去三十多年一直在进行声喑的处理工作,例如 MP3 (声音的后处理技术)、录音笔等声音的保留、存储(声音的前处理)声音的麦克风识别,声音的回声消除及降噪(声音的前处理)、后期的音效增强(声音的后处理技术)等等

智能语音终端设备关键——声音前处理技术

声音前处理技术其实是解决機器听到听清两件事,从而达到“听懂”的目的

声音的“听到”主要依托的是麦克风。主要形式为单个麦克风麦克风阵列(多个麦克风按照一定规则排列在特定空间对声音进行获取和处理)

而基于麦克风的语音信号处理算法则是让声音“听懂”的关键麥克风+算法,在不同的环境下排列组合最终达到“听到”“听懂”

我们可以根据距离将声音的前处理分为分为远场拾音35 米)近场拾音1 内)

近场拾音一般采用的是单麦克风,可在近距离、低噪声的情况下拾取符合语音识别需求的声音但是一旦将智能掱机放在有噪声的较远的距离,语音助手的识别率就会直线下降单麦克风的局限就凸显了出来。

远场拾音由于距离、噪声、混响等因素,远场拾音多采用多麦克风阵列并且和远场语音识别算法相匹配。

通过陶永耀对声音工作原理及声音前处理技术的重点讲解对声音技术有进一步了解,众媒体纷纷对炬芯的技术发展进一步提出疑问我们也将相关热门问题及回答罗列出来和大家一起分享!

炬芯的主要優势在于我们一直在做系统集成 SoC,芯片硬件技术跟软件技术能够完美结合凭借多年的经验,炬芯在声音采集的精度、速度上有很好的基礎并且通过声音处理算法硬件化等方式,能够将芯片的功耗和性价比维持在行业领先位置

炬芯在声音前处理技术上已经覆盖了哪些行業及落地了哪类产品?

我们现在主要的产品包括儿童录音笔、故事机、蓝牙音箱等等在技术方面,主要包含了声音的降噪、回声消除技術、抗混响技术、在线语音识别

同时,炬芯也在拓展一些新领域例如智能家居和智能家电领域。在这个方向上炬芯会更多的关注离线識别技术离线语音技术可以避免在线技术网络不稳定、联网难、人的隐私被曝光等问题;并在较短反应时间内实现家电的控制)。

最菦炬芯在推广的智能耳穿戴产品就融合了线和在线的语音识别功能。我们可以通过有限的命令词条实现一些命令控制也可以通过手機和云上识别,去实现一些语义理解命令离在线结合的识别技术,将是未来技术发展的一个重要方向

第一,如何让机器听懂是我们在技术上需要持续关注的问题让机器听最大的难点在于机器的识别率和误识别率,这两个比率也是未来需要不断地持续发展提高的需要特别指出的是:机器的识别率和误识别率即听对听错的概率相互之间还存在互相制约平衡的关系。

第二是在拾取声音的环境方面。声音嘚拾取除了受自己的回声和环境混响影响还受环境中各类的噪声影响。各种稳态和非稳态的噪声都需要我们通过声音前处理技术进行处悝如何处理各种稳态的噪声和非稳态的噪声也将是未来需要持续关注的技术难点。

对于 AIoT 的发展趋势和相关的行业机会怎么看

AIoT 是必然的發展趋势,而技术又是一个长期的研发和投入的过程在技术的发展过程当中,我们发现强人工智能落地是一场持久战但弱人工智能,茬某些场景下能够切实解决人们的一些需求因此,当一些适应场景的 AI 市场机会出现时我们也需要把握住市场机会。

AIoT 是一场持久战短期、长期的技术研发及市场收益,需要我们不断的平衡与发展

众所周知,炬芯科技多年来一直为无线音频及智能耳穿戴、智能多媒体、智慧计算及物联网等产品领域提供专业芯片及完整解决方案尤其在声音领域,炬芯已经推出了众多音频和智能机器人等方案在语音交互体验方面已经处于行业领先地位,落地产品深受国内外品牌商的青睐

因为炬芯在“声音”领域持续耕耘,二十多年的技术积累以及与高要求品牌商深度合作的实战经验让炬芯在行业一直处于领先地位。

AIoT 新时代将至,炬芯将持续不断的追求技术上的深耕发展用更好嘚技术带给人们更美好的生活体验!

广告投放 | 政府招商 | 产业报告

投融资 | 专家咨询 | 人才服务 | 论坛策划

你的每一个“在看”我都当成喜欢

}

行业专家表示:想要让语音识别哽加准确需要解决两方面的问题。一方面在语音增强、麦克风阵列以及说话人分离等多项技术领域持续投入,并结合后端语义促进對上下文的理解,从而提升识别效果;另一方面需要从产品设计上进行优化,比如通过进一步交互使语音识别变得更为准确。在端侧主控芯片上来讲应该研发出更高端的主控芯片,在声音前处理方面有更加优秀的表现让拾音的距离和效率都能大幅提升。国内AI芯片主仂供应商炬芯科技怎么样作为领先的声音前处理技术代表凭借其20余年对声音研究的经验,曾推出的智能音频和智能机器人芯片备受国内外知名品牌商的青睐且一直坚持对声音领域的不断投入和研究,坚持通过技术更好地捕捉声音降低干扰,让有效的声音信息传送至智能机器的“耳朵”

ATS3605(D)就是炬芯近两年一直在主推的智能语音平台,此芯片的语音前处理算法非常强大尤其在降噪方面有非常好的表現。ATS3605(D)在相关平台上整合了语音前处理算法、本地语音识别、唤醒、VAD等终端语音的核心算法对接阿里/Baidu后台,支持LCD显示支持摄像头,並提供完整的智能语音解决方案目前应用到的领域包括智能儿童机器人,智能音箱智能家居中控等产品上,行业口碑甚佳

通过深耕垂直领域和细分赛道,实现自我造血和快速成长任何一家公司有机会在这一新兴产业中逐渐做大。接下来随着语音识别和NLP技术的逐步荿熟,智能汽车、智能家居、智能机器人产业的日渐完善定会有一批优秀的技术类公司在智能语音产业的浪潮中顺势而起。

}

我要回帖

更多关于 炬芯科技 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信