創澤機器人
CHUANGZE ROBOT
當前位置: 首頁> 新聞資訊> 行業動態> ICRA 自然語義引導的機器人技能操作

ICRA 自然語義引導的機器人技能操作

來源: CAAI認知係統與信息處理專委會編輯: 創澤時間:2023/11/7 主題: 其他[ 加盟]

隨著自然語言處理技術的發展以及客戶需求的提高,當機器人進入以人為主的環境時,必須學會理解人類語言,完成指定任務。相較於傳統隻對場景做出反應的機器人操作方法,結合語義輸入,讓機器人理解人類語言,根據場景和自然語言指令完成相應任務,能為人機協作帶來更大的便利性。然而,目前該方法具有如下限製:

(1)依賴手工編碼任務符號來實現語義表達,限製了語義層麵的泛化性。

(2)從指令中推斷動作序列時,需要密集的子目標監督。

(3)缺乏更深層次的以目標為中心的推理方法,在解釋複雜指令時不連貫。

針對上述問題,該文章提出了一種可感知視覺場景,同時處理語言輸入的端到端可訓練的模型。該模型使用視覺輸入得到當前場景中物體在初始狀態下的位置關係,以語義文字推理目標狀態下對應的位置關係,實現由自然語言引導機器人進行技能操作。 相關成果以“Learning Neuro-symbolic Programs for Language Guided Robot Manipulation”為題發表於International Conference on Robotic and Automation (ICRA)會議中。

該文章提出了一種新型神經符號模型,使用自然語言推理目標場景,實現在給定初始場景和目標場景的情況下即可學習執行複雜的操作任務,並展示了如何在不需要任何中間監督的情況下,僅使用初始與目標兩個場景作為監督來獲取機器人操作動作的密集表示。 實驗表明,該文章的方法可通過端到端的訓練而不需進行任何子目標監督,即可展現出強大的指令理解能力,並對新場景和指令展現出強大的泛化能力,為將來基於自然語言的人機協作,機器人的語義指令集的拓展提供了新的參考思路。

1、模型結構設計

該端到端模型的結構如圖1所示,由視覺提取器、語言解釋器、視覺解釋器、動作模擬器組成。輸入初始場景和基於自然語言的任務指令,模型輸出完成該指令所需的動作參數,以及預測完成任務後的最終場景。

視覺提取器相當於一個目標檢測模型,用於識別初始場景下的物體信息。以圖11為例,輸入桌麵初始狀態的圖像,視覺提取器輸出各個物體的外接框、顏色信息及物體名稱,並由外接框在桌麵上的相對位置推斷物體的位置信息。

語言解釋器用於處理自然語言指令推理任務中隱含的操作動作。例如圖中“移動綠色骰子後麵的紅色骰子至紅色方塊的右邊”這句指令,語言解釋器經過推理會得到完成該任務需要進行“移動”動作,移動的物體是“位於綠色骰子後麵的紅色骰子”,目標是“紅色方塊右邊”,並可屏蔽“綠色方塊”和“藍色骰子”這些與完成任務無關的信息。推理完畢後,以專用指令集組合出推理結果。

專用指令集的結構如圖2所示,分為“關鍵詞”和“操作詞”,前者用於描述物體信息,後者用於表示操作信息。

視覺解釋器結合前二者輸出的場景信息和任務指令集,輸出完成該任務所需的參數化表示,交由任務模擬器生成機器人所能執行的動作參數,並預測完成任務後的場景情況。

以預測場景和數據集中提前設定好的目標場景做差,設置損失函數,即可實現端到端的訓練過程。


人形機器人的落地思考-場景聚焦明確產品形態考慮成本設計

要立足場景正向設計產品從場景出發解決問題;續航能力將是製約人形機器人應用和發展的又一個重要因素;需要做到萬元級別的成本才有可能大麵積進入家庭

中國公共服務機器人產業鏈研究報告2023-市場規模總量提升較快,企業總量增速放緩

服務機器人的市場規模在2019年後快速增長,預計到2025年CAGR將達到近65%;人形機器人會是未來公共服務機器人主要形態,軟件升級引領硬件發展

中國服務機器人行業未來的主要發展趨勢

商業模式創新,打造一體化服務,持續拓展下遊細分賽道;業務模式創新,多場景融合,實現實現一個服務機器人可以完成在多場景下完成工作

中國服務機器人行業發展目前麵臨的潛在風險

新科技的出現可能會對傳統服務機器人廠商造成 一些衝擊;優秀畢業生首選行業是軟件和信息服務可能會導致人才供給不足等風險;行業內公司經營模式相似度過高

中國服務機器人行業發展目前麵臨的主要挑戰

收入和研發費用的比例均超過了5%;國產機器人推廣應用麵臨新場景拓展慢的挑戰;代理商分銷的方式可以有效的幫助服務機器人廠商也會造成市場的惡意競價

服務機器人在中國市場短期迎來向好拐點 需求增長

在已使用或計劃使用服務機器人的企業中,酒旅,金融服務,餐飲快消行業滲透率最高,均超過20%;2023年6月我國服務機器人產量為662658台,同比增長40%

服務機器人產業迎來向好拐點 增長空間巨大

進入2023年後服務機器人產量同比增長47.6%,結束了連續12個月的同比下滑;人工智能技術的突破也將給服務機器人從語音,視覺,決策,控製四個方麵帶來賦能

創澤上市輔導進展情況報告(第十三期)20230414

中原證券參與輔導工作的人員為高岩,趙岩,鄒堅貞,胡殿軍,李雅璿,開展輔導的方式主要包括持續關注相關行業領域熱點信息

環境感知的核心SLAM算法基本結構可分為前端和後端

算法在前端完成占據柵格地圖的構建,得出激光雷達掃描幀的最佳位姿後,後端根據掃描幀間的位姿關係進行全局的地圖優化,得出閉環掃描幀在全局地圖中的最佳位姿

環境感知模塊中基於激光雷達或視覺傳感器的SLAM算法是核心

環境感知模塊的基礎硬件是各類不同的傳感器,收集不同的測量信息,SLAM算法用於融合收集的信息數據,機器人可以在未知環境中進行自主探索和導航

運動控製、環境感知與人機交互是公共服務機器人三大核心技術模塊

環境感知模塊主要依靠如激光雷達實現對內外部環境狀態信息的獲取;運動控製模塊主要依靠控製器等硬件實現派發的位置指令;人機交互模塊主要依靠多模態信息理解交互技術

公共服務機器人產業鏈價值集中於上遊核心技術與下遊商業服務環節

公共服務機器人產業鏈符合“微笑曲線”理論,產業鏈附加價值集中於上遊核心技術部分以及中遊機器人廠商對下遊用戶的商業行為,中遊機器人 整機製造商一般具備部分上遊核心技術
資料獲取
行業動態
==最新資訊==
ICRA 自然語義引導的機器人技能操作
2023語義增強可編程知識圖譜SPG白皮
2023 中國人工智能係列白皮書--人工
2023中國人工智能係列白皮書《人工智能
AI大模型市場研究報告(2023)邁向通
深圳2023人工智能發展白皮書-人工智能
人形機器人的落地思考-場景聚焦明確產品形
銀行保險金融機構生成式人工智能戰略報告-
中小學階段的人工智能課程報告-人工智能課
中國公共服務機器人產業鏈研究報告2023
上海機器人產業園產業政策及入住代表性企業
2023年中國AI技術變革企業服務白皮書
中國服務機器人行業未來的主要發展趨勢
中國服務機器人行業發展目前麵臨的潛在風險
中國服務機器人行業發展目前麵臨的主要挑戰
==機器人推薦==
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人開發平台

機器人開發平台


機器人底盤Disinfection Robot消毒機器人講解機器人迎賓機器人移動機器人底盤商用機器人智能垃圾站智能服務機器人大屏機器人霧化消毒機器人紫外線消毒機器人消毒機器人價格展廳機器人服務機器人底盤核酸采樣機器人機器人代工廠智能配送機器人噴霧消毒機器人圖書館機器人導引機器人移動消毒機器人導診機器人迎賓接待機器人前台機器人消殺機器人導覽機器人
版權所有 必威主頁中國運營中心:北京 清華科技園九號樓5層 中國生產中心:山東日照太原路71號
銷售1: 4006-935-088銷售2: 4006-937-088客服電話: 4008-128-728

Baidu
map