創澤機器人
CHUANGZE ROBOT
當前位置:首頁 > 新聞資訊 > 機器人開發 > 大模型在機器人L域研究與應用案例彙總

大模型在機器人L域研究與應用案例彙總

來源:G工機器人     編輯:創澤   時間:2024/10/17   主題:其他 [加盟]

目前大模型技術已從單純的大語言模型(LLM)發展到圖像-語言多模態模型(VLM)乃 至圖像-語言-動作多模態模型(VLA),其中圖像-語言-動作多模態模型(VLA)的推出,實 現了數據與處理任務的躍升。從文本到圖像再到現實世界,大模型的數據模態逐漸豐富,數 據規模的數量級迅速增長,大模型的應用場景和價值量也成比例擴張。

在人形機器人L域,AI 大模型將會從感知(語音、視覺)、決策、控製等多方麵與人形 機器人結合,形成感知、決策、控製閉環,提升機器人的智能水平。

未來人形機器人大模型的方向將會是感知-決策-控製一體化的端到端通用大模型,集合 大規模數據集管理、雲邊端一體計算架構、多模態感知與環境建模等技術。

1 微軟 ChatGPT

在機器人L域的應用主要體現在兩個方麵:自然語言交互和自動化決 策。在自然語言方麵,機器人可以通過 ChatGPT 來理解人類的自然語 言指令,並根據指令進行相應的動作;在自動化決策方麵,機器人可以 通過 ChatGPT 來生成任務方案,根據任務要求做出相應的決策。

柏林工業大學和 Google Robotics 團隊 PaLM-E

是大的多模態視覺語言模型,在 PaLM 模型基礎上,引入了具身化和 多模態概念,實現了指導現實世界機器人完成相應任務的功能。

2 穀歌 RT-2

D一個控製機器人的視覺-語言-動作(Vision-Language-Action, VLA)模型,通過將 VLM 預訓練與機器人數據相結合,能夠端到端直接 輸出機器人的控製。

斯坦福大學李飛飛團隊 VoxPoser

智能係統 VoxPose 可以從大模型 LLM 和視覺語言模型 VLM 中提取可行 性和約束,以構建 3D 仿真環境中的值地圖,供運動規劃器使用,用於 零樣本地合成機器人操縱任務的軌跡,從而實現在真實世界中的零樣 本機器人操縱。

3 Meta 和 CMU 團隊 RoboAgent

采用了大規模機器人數據集進行訓練,考慮到機器人在現實世界中的 訓練和部署效率問題,Meta 將數據集限製到了 7500 個操作軌跡中,並 基於此讓 RoboAgent 實現了 12 種不同的複雜技能,包括烘焙、拾取物 品、上茶、清潔廚房等任務,並能在 100 種未知場景中泛化應用。

4 英偉達 Eureka

該係統以 OpenAI 的 GPT-4 為基礎,本質是一種由大模型驅動的算法生 成工具,能訓練實體機器人執行例如“轉筆”、“開抽屜”、“拿剪 刀”、“雙手互傳球”等多種複雜動作。

5 英偉達 GR00T

目標是成為人形機器人通用大模型,旨在讓人形機器人理解自然語言文本、語音、視頻,以模仿人類運動,並與現實世界互動。

6 阿裏雲機器人大模型

方案集成了通義千問、通義萬相等基礎模型及阿裏雲物聯網平台,可賦予機器人知識庫問答、工藝流程代碼生成、機械臂軌跡規劃、3D 目標 檢測和動態環境理解等全方位能力,不僅可以大幅降低機器人開發的 門檻,還讓機器人輕鬆完成靈活性更G的非標任務,推動機器人在更廣 泛的應用場景落地。

7 華為盤古大模型

“盤古”大模型具備強大的語義理解、動態規劃、多模態信號理解等能 力,將為人形機器人大模型的開發提供智能化決策基礎。依托盤古大模 型的數據處理能力,可建立豐富且G質量的人形機器人數據集,並且充分發揮盤古大模型的多模態能力,實現複雜任務場景下綜合感知和任 務分解,提升各類泛化場景下的具身智能操作水平。



【聲明:轉載此文出於傳遞更多信息之目的,並不意味著讚同其觀點或證實其描述,文章內容僅供參考,如有侵權,請聯係刪除。】


智能機器人純視覺與激光雷達方案比較

純視覺方案:成本低,技術成熟度G,產業鏈成熟度G,符合人眼邏輯;易受天氣影響,易受光照影響,算力需求較G,需要大量圖像訓練集;激光雷達方案:識別率G,環境適應力強,產業鏈成熟度G

人形機器人四種環境感知傳感器各項性能比較

攝像頭可實現測距,但精度較低,通過 AI 算法識別,但難 以識別非標準障礙物;毫米波雷達縱向精度G,橫 精度低;激光雷達是G精度,3D 建模,易識別;

主要人形機器人的控製解決方案彙總

本田 ASIMO由四個運行著 VxWorks 實時操作係統的處理器構成;歐洲 ICUB使用名為 ARCHER 的學習型算法體係;特斯拉 Optimus用Optimus 的神經網絡

人形機器人絲杠行業深度報告: 核心傳動精密部件,國產化未來可期,市場規模249.5億元

人形機器人將實現從0到1量產,根據我們測算,2025年和2030年人形機器人市場規模 分別有望達到1.4億元和249.5億元,2025-2030年人形機器人CAGR有望達到182%

人形機器人執行係統之靈巧手-空心杯電機

人形機器人靈巧手進行抓取動作,空心杯電機為核心部件;信號解析 彙總執行 輸出轉速 (G速、低扭矩) 降速增扭 直線傳動轉 換為旋轉傳 動 驅動傳導 感知及力 反饋

人形機器人執行係統之旋轉執行器-減速器

旋轉執行器分布於肩部、手部等多自由度關節,作用是將某物旋轉到一定角度完成旋轉運動;驅動關節完成旋轉動作,減速器為核心部件

人形機器人執行係統之線性執行器-行星滾柱絲杠

線性執行器位於膝肘等單自由度及腕踝等雙自由度關節,將電機旋轉運動轉為直線運動;變旋轉運動為直線運動,行星滾柱絲杠為核心部件

人形機器人整體構造及成本拆解:執行係統較為關鍵

人形機器人感知係統成本占比7.3%,執行係統成本占比53.2%;線性執行器成本占比31.0%;旋轉執行器成本占比17.9%;其他成本占比39.5%

人形機器人BOM拆解分析-三大核心部分

執行係統BOM占比G,約53.2%(其中直線、旋轉、手部分別 占31.0%、17.9%、4.3%);感知係統占7.3%,其他芯片、電池等部件合計占比39.5%

中國人形機器人研發團隊-24支機器人團隊介紹

國防科技大學Blackman;哈爾濱工業大學HIT Humanoid; 理工彙童;浙江大學悟空;優必選WalkerX、優悠;小鵬汽車PX5;達闥科技XR-4;北京鋼鐵俠

工控&機器人係列深度-人形機器人空心杯電機:迎國產替代機遇

空心杯市場規模從2021年的6.75億美元增長至2025年的9.36億元,CAGR為8.52%。2021年空心杯電機市場規模僅占微特電機的1.73%

人形機器人擎天柱Optimus隻申請外觀設計專利(共 5 件)

特斯拉的外觀專利全部有效,且主要集中在日本(4 件)和歐洲(1 件),其他已申請的方法類、結構類專利可能尚未公開
資料獲取
機器人開發
== 資訊 ==
大模型在機器人L域研究與應用案例彙總
智能機器人純視覺與激光雷達方案比較
人形機器人四種環境感知傳感器各項性能比較
主要人形機器人的控製解決方案彙總
中國未來五十年人工智能行業生態全景—AI
中國未來五十年人工智能行業生態全景—關鍵
中國近幾年人工智能相關政策彙總
中國人工智能競爭與發展潛力—技術優勢
2024智能算力產業發展白皮書-算力規模
大模型安全實踐白皮書2024-安全性、可
中國未來50年產業發展趨勢白皮書-人工智
青島市人工智能產業-打造具有競爭力的
脈脈2024大模型人才報告-人才供需比為
AI醫學影像行業發展現狀與未來趨勢藍皮書
2024中國具身智能創投報告:背景現狀、
== 機器人推薦 ==
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人開發平台

機器人開發平台


機器人底盤 Disinfection Robot 消毒機器人  講解機器人  迎賓機器人  移動機器人底盤  商用機器人  智能垃圾站  智能服務機器人  大屏機器人  霧化消毒機器人  紫外線消毒機器人  消毒機器人價格  展廳機器人  服務機器人底盤  核酸采樣機器人  智能配送機器人  導覽機器人 
版權所有 必威主頁 中國運營中心:北京 清華科技園九號樓5層 中國生產中心:山東日照太原路71號
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728

Baidu
map