服務機器人自適應語音定位系統 | 項目資料庫 | Logistics and Supply Chain MultiTech R&D Centre


項目簡介	可靠的語音識別是服務機器人至關重要的功能。項目的主要目標是開發基於視覺的波束形成器技術，並實現實時高質量的語音採集。通過視覺信息構建立體面部模型，並且可以定位嘴部位置。波束形成器基於立體角和距離信息, 優化採集口部位置聲音。關鍵研究方向是實現視音頻同步和語音處理。針對立體圖像特徵，可以重構深度點雲。進一步運用深度相機作為冗餘傳感器,以適應不同應用場景。波束形成器調整有限脈衝響應（FIR）濾波器係數，並使陣列模式優化, 採集坐標。技術核心問題是建立對準與波束形成器濾波器係數和圖像幀，重點研究校準算法以實現視覺音頻同步。通過使用服務機器人平台進行系統整合和性能演示。

項目簡介

可靠的語音識別是服務機器人至關重要的功能。項目的主要目標是開發基於視覺的波束形成器技術，並實現實時高質量的語音採集。通過視覺信息構建立體面部模型，並且可以定位嘴部位置。波束形成器基於立體角和距離信息, 優化採集口部位置聲音。關鍵研究方向是實現視音頻同步和語音處理。針對立體圖像特徵，可以重構深度點雲。進一步運用深度相機作為冗餘傳感器,以適應不同應用場景。波束形成器調整有限脈衝響應（FIR）濾波器係數，並使陣列模式優化, 採集坐標。技術核心問題是建立對準與波束形成器濾波器係數和圖像幀，重點研究校準算法以實現視覺音頻同步。通過使用服務機器人平台進行系統整合和性能演示。


項目編號	ITP/054/19LP
研發單位	LSCM研發中心
項目統籌員	黎振偉先生
資助金額	港幣二百七十九萬
項目週期	2020年2月24日至2021年5月16日

項目編號

ITP/054/19LP

研發單位

LSCM研發中心

項目統籌員

黎振偉先生

資助金額

港幣二百七十九萬

項目週期

2020年2月24日至2021年5月16日