服务机器人自适应语音定位系统 | 项目资料库 | Logistics and Supply Chain MultiTech R&D Centre


项目简介	可靠的语音识别是服务机器人至关重要的功能。项目的主要目标是开发基于视觉的波束形成器技术，并实现实时高质量的语音采集。通过视觉信息构建立体面部模型，并且可以定位嘴部位置。波束形成器基于立体角和距离信息, 优化采集口部位置声音。关键研究方向是实现视音频同步和语音处理。针对立体图像特征，可以重构深度点云。进一步运用深度相机作为冗余传感器,以适应不同应用场景。波束形成器调整有限脉冲响应（FIR）滤波器系数，并使阵列模式优化, 采集坐标。技术核心问题是建立对准与波束形成器滤波器系数和图像帧，重点研究校准算法以实现视觉音频同步。通过使用服务机器人平台进行系统整合和性能演示。

项目简介

可靠的语音识别是服务机器人至关重要的功能。项目的主要目标是开发基于视觉的波束形成器技术，并实现实时高质量的语音采集。通过视觉信息构建立体面部模型，并且可以定位嘴部位置。波束形成器基于立体角和距离信息, 优化采集口部位置声音。关键研究方向是实现视音频同步和语音处理。针对立体图像特征，可以重构深度点云。进一步运用深度相机作为冗余传感器,以适应不同应用场景。波束形成器调整有限脉冲响应（FIR）滤波器系数，并使阵列模式优化, 采集坐标。技术核心问题是建立对准与波束形成器滤波器系数和图像帧，重点研究校准算法以实现视觉音频同步。通过使用服务机器人平台进行系统整合和性能演示。


项目编号	ITP/054/19LP
研发单位	LSCM 研发中心
项目统筹员	黎振伟先生
资助金额	港币二百七十九万
项目週期	2020年2月24日至2021年5月16日

项目编号

ITP/054/19LP

研发单位

LSCM 研发中心

项目统筹员

黎振伟先生

资助金额

港币二百七十九万

项目週期

2020年2月24日至2021年5月16日