RoboTwin:生成式數(shù)字孿生的雙臂機(jī)器人基準(zhǔn)
雙臂機(jī)器人的有效協(xié)作及其工具使用能力,是機(jī)器人技術(shù)進(jìn)步中越來越重要的領(lǐng)域。這些技能在擴(kuò)展機(jī)器人各種現(xiàn)實(shí)環(huán)境中運(yùn)行能力的方面發(fā)揮著重要作用。然而,由于缺乏專門的訓(xùn)練數(shù)據(jù),進(jìn)展受到阻礙。RoboTwin,是一個(gè)基準(zhǔn)數(shù)據(jù)集,它將現(xiàn)實(shí)世界的遙控?cái)?shù)據(jù)與數(shù)字孿生的合成數(shù)據(jù)相結(jié)合,專為雙臂機(jī)器人場景而設(shè)計(jì)。使用
RT-Affordance:Affordance是機(jī)器人操作的多功能中間表示
RT-Affordance 是一個(gè)分層模型,它首先根據(jù)任務(wù)語言提出 affordance 規(guī)劃,然后根據(jù)此 affordance 規(guī)劃條件化策略以執(zhí)行操作。本文模型可以靈活地連接異構(gòu)監(jiān)督源,包括大型網(wǎng)絡(luò)數(shù)據(jù)集和機(jī)器人軌跡。還在廉價(jià)收集的域內(nèi) affordance 圖像上訓(xùn)練模型,能夠?qū)W習(xí)新任務(wù)而無需
EgoMimic:通過以自我為中心的視頻規(guī)模化模仿學(xué)習(xí)
EgoMimic探索了一種通過第一視角視頻擴(kuò)展模仿學(xué)習(xí)的方法,解決了傳統(tǒng)模仿學(xué)習(xí)需要大量專家演示的限制。該方法利用人類的自我中心視頻來提取操作技能,使得人形機(jī)器人可以在更加復(fù)雜和動(dòng)態(tài)的環(huán)境中進(jìn)行有效學(xué)習(xí)和操作。通過對不同環(huán)境和操作任務(wù)的測試,EgoMimic證明了其在提升人形機(jī)器人復(fù)雜操作能力方面
[論文閱讀]Generalizable Humanoid Manipulation with Improved 3D Diffusion Policies
本文提出了一種改進(jìn)的3D擴(kuò)散策略,旨在提升人形機(jī)器人在操作任務(wù)中的泛化能力。通過采用自我中心的3D視覺表示,該策略克服了傳統(tǒng)方法中依賴相機(jī)校準(zhǔn)和點(diǎn)云分割的限制,使得全尺寸人形機(jī)器人能夠在多樣的真實(shí)場景中自主執(zhí)行技能,僅使用在實(shí)驗(yàn)室收集的數(shù)據(jù)。此外,該研究還展示了如何在不同環(huán)境中有效部署這一策略,從而
EMOS: 基于大語言模型的異構(gòu)多機(jī)器人操作系統(tǒng)
本文介紹了基于大語言模型的異構(gòu)多機(jī)器人操作系統(tǒng)EMOS的相關(guān)內(nèi)容。
一套基本的具身智能AI技術(shù)流程是如何實(shí)現(xiàn)的
本文將深入探討如何將LLM和多模態(tài)大模型與機(jī)器人技術(shù)相結(jié)合,構(gòu)建一套完整的具身智能技術(shù)流程。從系統(tǒng)架構(gòu)設(shè)計(jì)到具體模塊的實(shí)現(xiàn),涵蓋了最新的LLM、多模態(tài)大模型與機(jī)器人技術(shù)的集成方法。通過詳細(xì)的技術(shù)分析和代碼示例,展示了如何實(shí)現(xiàn)AI機(jī)器人的自主決策與執(zhí)行能力。
ROS2架構(gòu)與通信模型介紹
本文介紹了機(jī)器人操作系統(tǒng)ROS2架構(gòu)與通信模型。
人形機(jī)器人關(guān)節(jié)驅(qū)動(dòng):空心杯電機(jī)
本文將深入探討空心杯電機(jī)的技術(shù)路線、優(yōu)勢以及在人形機(jī)器人領(lǐng)域的應(yīng)用前景。
一文熟悉人形機(jī)器人之眼:機(jī)器視覺
本文介紹了人形機(jī)器人的機(jī)器視覺相關(guān)內(nèi)容。
