加利福尼亞大學圣地亞哥分校(UCSD)和南加利福尼亞大學(USC)的研究人員最近推出了一種名為 CyberDemo 的新型人工智能框架,旨在通過視覺觀察進行機器人模仿學習。

傳統的模仿學習方法通常需要大量高質量的示范數據來教導機器人完成復雜任務,特別是對于需要高度靈巧的任務來說。然而,CyberDemo 通過利用模擬人類示范來完成真實世界的機器人操縱任務,從而減少了對物理硬件的需求,使得遠程和并行數據收集成為可能。此外,通過模擬器專屬的數據增強技術,CyberDemo 顯著增強了任務性能,生成的數據集比在真實世界環境中收集的數據集大得多。
CyberDemo 的方法從在模擬環境中使用低成本設備進行遠程操作收集人類示范開始。隨后,通過廣泛的增強方法對數據進行豐富處理,包括各種視覺和物理條件,以提高訓練策略對真實世界變化的魯棒性。該框架采用課程學習策略進行策略訓練,首先使用增強數據集,然后逐漸引入真實世界示范以對策略進行微調。與使用真實世界示范數據微調的預訓練策略相比,這種方法確保了平穩的從模擬到現實的過渡,解決了光照、物體幾何和初始姿勢變化等問題,而無需額外的示范。

在各種操縱任務中,CyberDemo 的性能令人印象深刻。相比傳統方法,CyberDemo 在任務成功率上取得了顯著提高。尤其值得注意的是,在涉及未見過的物體時,CyberDemo 的泛化能力特別突出,在旋轉新物體的成功率達到42.5%,這是傳統方法表現的顯著飛躍。對比基線包括先進的視覺預訓練模型如 PVR、MVP 和 R3M,CyberDemo 的成功之處突顯了其效率和穩健性,以及其能夠勝過在真實世界示范數據集上微調的模型。
CyberDemo 的創新方法通過利用增強的模擬數據挑戰了解決實際問題必須依賴真實示范數據的傳統觀念。通過 CyberDemo 的性能所展示的經驗數據,突顯了通過數據增強增強的模擬數據在機器人操縱任務的價值方面能夠超越真實世界數據。雖然為每個任務設計模擬環境需要額外的工作,但減少了數據收集的人為干預,并避免了復雜的獎勵設計過程,為機器人操縱領域帶來了一種可擴展且高效的解決方案。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。