芭乐视频下载官网大全_国产午夜亚洲精品第一区 _李美淑三级未删减版在线观看98_公车上乱j伦小说诱爱

創澤機器人
CHUANGZE ROBOT
當前位置:首頁 > 新聞資訊 > 行業動態 > OmniManip引⼊了 VLM 規劃和機器⼈執⾏的雙閉環系統設計,提升機器人3D操作能力

OmniManip引⼊了 VLM 規劃和機器⼈執⾏的雙閉環系統設計,提升機器人3D操作能力

來源:機器人大講堂     編輯:創澤   時間:2025/1/27   主題:其他 [加盟]

近年來視覺語⾔基礎模型(Vision  Language  Models,  VLMs)在多模態理解和⾼層次常識推理上⼤放異彩,如何將其應⽤于機器⼈以實現通⽤操作是具身智能領域的⼀個核⼼問題。這⼀⽬標的實現受兩⼤關鍵挑戰制約:

1. VLM 缺少精確的 3D 理解能⼒:通過對⽐學習范式訓練、僅以 2D 圖像 / ⽂本作為輸⼊的 VLM 的天然局限;

2. ⽆法輸出低層次動作:將 VLM 在機器⼈數據上進⾏微調以得到視覺 - 語⾔ - 動作(VLA)模型是⼀種有前景的解決⽅案,但⽬前仍受到數據收集成本和泛化能⼒的限制。

針對上述難題,北⼤攜⼿智元機器⼈團隊提出了 OmniManip 架構,基于以對象為中⼼的 3D 交互基元,將 VLM 的高層次推理能力轉化為機器⼈的低層次高精度動作。

針對⼤模型幻覺問題和真實環境操作的不確定性,OmniManip 創新性地引⼊了 VLM 規劃和機器⼈執⾏的雙閉環系統設計,實現了操作性能的顯著突破。

實驗結果表明,OmniManip 作為⼀種免訓練的開放詞匯操作⽅法,在各種機器⼈操作任務中具備強⼤的零樣本泛化能⼒。

OmniManip 的關鍵設計包括:

基于 VLM 的任務解析:利⽤ VLM 強⼤的常識推理能⼒,將任務分解為多個結構化階段(Stages),每個階段明確指定了主動物體(Active)、被動物體(Passive)和動作類型(Action)。

以物體為中⼼的交互基元作為空間約束:通過 3D 基座模型⽣成任務相關物體的 3D 模型和規范化空間(canonical space),使 VLM 能夠直接在該空間中采樣 3D 交互基元,作為 Action 的空間約束,從⽽優化求解出 Active 物體在 Passive 物體規范坐標系下的⽬標交互姿態。

閉環 VLM 規劃:將⽬標交互姿態下的 Active/Passive 物體渲染成圖像,由 VLM 評估與重采樣,實現 VLM 對⾃身規劃結果的閉環調整。

閉環機器⼈執⾏:通過物體 6D 姿態跟蹤器實時更新 Active/Passive 物體的位姿,轉換為機械臂末端執⾏器的操作軌跡,實現閉環執⾏。

物體的交互基元通過其在標準空間中的交互點和⽅向來表征。交互點 p∈R3 表示物體上關鍵的交互位置,⽽交互⽅向 v∈R3 代表與任務相關的主要軸。這兩者共同構成交互基元 O={p,v},封裝了滿⾜任務約束所需的基本⼏何和功能屬性。這些標準交互基元相對于其標準空間定義,能夠在不同場景中保持⼀致,實現更通⽤和可重⽤的操作策略。

對于通⽤物體的交互點提取,OmniManip 利⽤視覺語⾔模型(VLM)在原圖(當部件可⻅且實體存在時)或在正交視圖中渲染的 3D ⽹格(當部件不可⻅或實體不存在時)上進⾏定位。

與 CoPa 和 ReKep 等⽅法不同,OmniManip 直接讓 VLM 進⾏ grounding,不會受限于不穩定的 part 分割或聚類結果。

在交互⽅向的采樣⽅⾯,由于物體的規范化空間通過 Omni6DPose 錨定,軸的⽅向與語義對⻬,該團隊讓 VLM 直接對物體標準空間的軸進⾏語義描述,并根據操作任務進⾏匹配度排序,以獲得交互⽅向的候選。

雙閉環系統設計

李⻜⻜團隊的⼯作 ReKep 通過關鍵點跟蹤巧妙地實現了機械臂的閉環執⾏,但其 VLM 規劃過程是開環的。OmniManip 則更進⼀步,得益于以物體為中⼼的設計理念,⾸次在 VLM 規劃和機械臂執⾏層⾯實現了雙閉環系統:

閉環規劃:在實驗中,VLM 推理很容易出現幻覺,導致錯誤的規劃結果(尤其是在涉及 3D 旋轉的任務中,如倒⽔、插筆)。OmniManip 賦予 VLM 閉環規劃能⼒,通過渲染物體的三維模型,幫助 VLM 「腦補」出規劃結果后的物體樣貌,再判斷其合理性。

這⼀功能賦予了 VLM 空間反思能⼒,使其能夠在測試時進⾏推理,類似于 OpenAI 的 O1,⼤⼤提⾼了操作成功率。為了保持框架的簡潔性,研究團隊沒有設計復雜的測試時推理流程,僅作⼀輪校驗就已明顯提⾼了 VLM 的規劃準確率。

閉環執⾏:OmniManip 提取的交互基元位于物體的規范空間中,只需引⼊⼀個 6D 位姿跟蹤器即可輕松實現閉環操作。與 ReKep 使⽤的關鍵點跟蹤器相⽐,基于物體的 6D 位姿跟蹤⽅式更為穩定,并對遮擋具有更強的魯棒性。(缺點則是不如關鍵點靈活、⽆法建模柔性物體操作。)

▍實驗結果

強⼤的開放詞匯操作性能

在 12 個真機短程任務上,OmniManip 均展現出卓越的性能。

雙閉環系統設計為 OmniManip 帶來了約 17% 的性能提升,這證明了 RRC 在有效減少⼤模型幻覺影響⽅⾯的作⽤。

交互基元的魯棒性

VLM 需要基于交互基元對機器⼈操作進⾏規劃,如果交互基元本身存在問題,VLM 就會陷⼊「巧婦難為⽆⽶之炊」的困境。因此,可靠的交互基元⾄關重要。以往的⽅法通常是讓 VLM 直接在相機拍攝的 2D 圖像上采樣交互基元,然后通過相機的內外參數轉換到 3D 空間。

然⽽,由于 2D 圖像存在空間歧義,采樣效果對相機視⻆、圖像紋理和部件形狀等因素極為敏感(例如,當相機平視杯⼦時,之前的⽅法只能對準杯⼦的側壁、⽽不是開⼝)。⽽ OmniManip 則是在物體的 3D 規范空間中進⾏采樣,能夠輕松克服 2D 圖像的局限性,實現可靠的 3D 交互基元提取。

強⼤的拓展性與潛⼒

OmniManip 能夠與 high-level 任務規劃器結合,實現⻓程任務操作

作為⼀種以物體為中⼼的算法,OmniManip 與機械臂本體解耦,能夠零成本遷移⾄不同形態的本體(例如雙臂⼈形機器⼈)。

OmniManip 具有強⼤的通⽤泛化能⼒,不受特定場景和物體限制。團隊已將其應⽤于數字資產⾃動標注 / 合成管道,實現⼤規模的機器⼈軌跡⾃動采集。



中國人工智能系列白皮書:復合多態機器人,具身智能重要實現路徑的技術特點、應用場景及未來發展潛力

探討了復合多態機器人作為具身智能重要實現路徑的技術特點、應用場景及未來發展潛力。報告通過多模態感知、多場景適應和功能解耦等技術核心,全面分析了智能機器人如何革新服務與生產模式

移動機器人(AGV_AMR)專用激光雷達產品發展藍皮書-銷售數量約210000 臺, 銷售規模約 8億

中國市場AG V/AMR專用激光雷達銷售數量約 210000 臺, 銷售規模約 8億元; 相信 3D多線 激光雷達將在移動機器人領域迅速打開市場

表情陪伴人形機器人:AI 陪伴的高級賽道,市場需求近萬億,老年人群中的潛在需求約4200億

測算出陪伴機器人在老年人群中的潛在需求約 4200億元人民幣,陪伴機器人在青年人群中的潛在需求約5000億元人民幣,在醫療場景下也有較大的應用前景

表情陪伴人形機器人:AI陪伴的高級賽道,需求近萬億,老年人需求約 4200億

人人都需要陪伴,中國陪伴機器人潛在市場需求近萬億;老年人群中的潛在需求約4200億元;在青年人群中的潛在需求約5000億,自閉癥兒童的情緒監控領域也有較大的應用前景

醫療場景陪伴機器人市場前景:潛在需求約39億

全球5歲以下患自閉癥兒童人數超過60萬人,平均每個兒童每年花費6萬 美元,每年治療費用約360億美元。假設當前的陪伴機器人價格為6500美 元(參考東芝的宮原香苗機器人價格6500美元~12000美元),若每個自閉 癥兒童配備一個陪伴機器人,潛在市場需求為39億美元

青年陪伴機器人市場前景:潛在需求約5000億

陪伴機器人在中國青年人群中的潛在市場需求約5000億,售價將會在0.5-6萬元區間,我們認為以2萬元/臺作為價格的中性假設是合理的

深圳人形機器人產業發展情況:具有人形機器人產業先發優勢

深圳市機器人產業發展良好,且擁有優必選、逐際動力、樂聚機器人等一批本體企業,發布了優必選Walker X、樂聚夸父、逐際動力CL-1等人形機器人產品,已具有人形機器人產業先發優勢

珠三角人形機器人產業發展情況:全球人形機器人供應鏈的重要集聚區

珠三角地區是全球人形機器人供應鏈的重要集聚區,控制、伺服系統技術較為領先;以深圳為發展重心,廣佛莞為發展主力的人形機器人產業發展格局

長三角人形機器人產業發展情況:完整的機器人產業鏈條

長三角是我國工業機器人產業發展最為完備的區域之一,產能規模大,產業鏈條完整,產業投資集聚度高,以上海為核心,蘇州、南京、常州、杭州、寧波、蕪湖多點發力的發展格局,綜合實力走在全國前列。

京津冀人形機器人產業發展情況:產業鏈協同發展模式

北京科技創新資源豐富,產業發展程度在三地居于首位,而天津與河北工業基礎也較雄厚且傳統產業轉型需求旺盛,故許多機器人企業采取北京研發,生產,落地在天津,河北的模式,且河北發展成為京津機器人企業的重要零部件供應地

老人陪伴機器人市場前景:潛在需求約4200億

陪伴機器人在中國老年人群中的潛在市場需求為4200億人民幣,未來中國陪伴機器人(含桌面級、寵物級、表情陪 伴機器人)的售價將會在0.5-6萬元區間

機器人產業面臨的三個主要問題:行業內卷無序價格競爭,關鍵核心技術和占有率低

機器人產品在技術上趨于同質化,難以形成明顯的差異化競爭優勢;部分關鍵核心技術仍需突破,限制產業進一步發展;部分國產機器人品牌在高端市場表現相對薄弱
資料獲取
行業動態
== 最新資訊 ==
OmniManip引⼊了
AI大模型賦能B端應用,高ROI場景將率
中國工業大模型行業發展研究報告-工業大模
AIGC實踐案例集錦:對話先行者,洞見新
2025年技術趨勢-構建一個更加個性化和
2025年五大趨勢:人智共創未來+點燃創
2025年十大AI技術趨勢-原生統一多模
2025年AI產業發展十大趨勢報告-應用
生成式AI賦能零售電商行業解決方案白皮書
技術革新引領未來—生成式AI如何塑造核心
智能家居無線互聯的發展趨勢,智能家居、智
2024中國智能客服市場研究報告:探索A
中國人工智能系列白皮書:復合多態機器人,
移動機器人(AGV_AMR)專用激光雷達
表情陪伴人形機器人:AI 陪伴的高級賽
== 機器人推薦 ==
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人開發平臺

機器人開發平臺


機器人底盤 Disinfection Robot 消毒機器人  講解機器人  迎賓機器人  移動機器人底盤  商用機器人  智能垃圾站  智能服務機器人  大屏機器人  霧化消毒機器人  紫外線消毒機器人  消毒機器人價格  展廳機器人  服務機器人底盤  核酸采樣機器人  智能配送機器人  導覽機器人 
版權所有 創澤智能機器人集團股份有限公司 中國運營中心:北京 清華科技園九號樓5層 中國生產中心:山東日照太原路71號
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728