1智能機器人三大核心技術模塊:感知+交互+運控
整個服務機器人產業建立在三大核心技術模塊:人機交互及識別模塊、環境感知模塊、運動控制模塊。依托于三大模塊,機器人有基礎的硬件:電池模組、電源模組、主機、存儲器、專用芯片等,還有操作系統:ROS、Linux、安卓等;由硬件和操作系統構成機器人整機,整合基礎硬件、系統、算法、控制元件,形成滿足一定行走能力和交互能力的機器人整機;在此基礎上形成各種基礎應用開發,基于機器人操作系統開發的控制類APP、管理員APP和各類應用程序App等;產生的數據將有群組服務、云服務、大數據服務等。
服務機器人的交互能力、感知能力、運動能力對應三大模塊。交互模塊包括語音識別、語義識別、語音合成、圖像識別等,相當于人的大腦;感知模塊借助于各種傳感器、陀螺儀、激光雷達、相機、攝像頭等,相當于人的眼、耳、鼻、皮膚等;運控模塊包括舵機、電機、芯片等。
服務機器人的各個細分模塊中,語音模塊重要性和成熟度均最高,語義模塊是目前突破重點,運控模塊相對重要性最弱。服務機器人三大模塊可以繼續細分為語音模塊、語義模塊、圖像模塊、感知模塊、運控模塊、芯片模塊。重要性排序依次為:語音模塊、語義模塊、芯片模塊、圖像模塊、感知模塊、運控模塊。成熟度重要性排序依次為:語音模塊、圖像模塊、運控模塊、感知模塊、語義模塊、芯片模塊。
從技術儲備上來看,人工智能是核心。目前的技術儲備方面,只有語音和OCR領域具備一定的成熟度。語音和OCR領域已發展接近20年,在某些特定場景和行業已經有了一些數據基礎。其他的技術包括圖像識別、語義分析都還在很早期的階段。語音領域,也是目前已知的平臺類企業最大的板塊。
2服務機器人多場景特征,多模態交互融合是關鍵
從第一代以鼠標和鍵盤的交互方式為特點的PC互聯網,到第二代以觸屏、GPS等交互方式為特點的移動互聯網,再到今天以多模態人機交互方式為特點的第三代互聯網,服務機器人產業,底層的邏輯就是人機交互方式的發展和演變。
隨著語音交互、視覺圖像交互、動作交互、腦電波交互等多模態人機交互技術的逐步發展和成熟,這些第三代人機交互方式將會深層次地改變我們日常生活的應用場景;同時,一場第三代互聯網的主流終端模式和服務內容入口的競爭也在同步進行。
什么是多模態交互?多模態融合了視覺、聽覺、觸覺、嗅覺等交互方式,其表達效率和表達的信息完整度要由于傳統單一的交互模式。人機交互是服務機器人場景化不可或缺的環節。傳統的交互模式中,大多是單一單向的交互方式。人機對話中,尤其是多輪人機對話,涉及到語音理解、語義分析、情感分析、動作捕捉等多個維度。