当前位置: CompoTech China > 专题 > 专题报道 >
 

智能语音交互,热线ing

本文作者:任苙萍       点击: 2021-02-22 11:28
前言:
疫情影响所及,在线会议或远距教学/医疗再推升语音互动需求,就连音效大师杜比 (Dolby) 也在 Audio 之外,发布可消除背景噪声和回声的 Voice 语音工具应市。另有厂商结合飞时测距 (ToF) 传感器、微机电 (MEMS) 压电微机械超声换能器 (PMUT)、数字信号处理器 (DSP) 与支援蓝牙低功耗 (BLE) 的微控制器 (MCU),打造出目标追踪或保持社交距离的解决方案。

就系统层级来看,从接收端到音频编/译码器、软件算法、DSP、音频放大器和扬声器 (喇叭) 的每个环节,都将影响语音互动的结果。于是,拥有更佳音质、灵敏度和定向性,便于从数据获取上、下文进行有效处理和渲染,且功耗、成本更低、体积小巧的 MEMS 麦克风,越发受到青睐;与此同时,DSP IP 供货商不断与各方开源工具和功能软件算法结盟以扩大市场,另为应对繁复的机器学习 (ML) 训练、推论任务,也开启了 AI 加速器、乃至专用处理器的采用风潮。

当声控跻身人机界面 (HMI) 主流,"语音互联网"正隐然成形。不过,只是呆板地遵命行事并不够,现在,语音助理还要善解人意并提供个性化服务,而这有赖自动语音识别 (ASR)、生物特征辨识、远场音频处理和听觉场景技术的加持,以进一步实现自然语言处理 (NLP)、情感检测及人与设备的无缝交互,也催生新型态的客户服务、交易支付、营销手法及内容制作等商业模式;当然,隐私与风险依旧是不可或忘的关注点……。智能语音交互有哪些可能?又有哪些必要思维?