Flexion Robotics 推出了 Reflect v1.0,這是一個機器人智能平台,能夠使類人機器人自主完成複雜的多步驟任務,而無需在執行過程中進行人為幹預。該公司通過一個工作場所的送貨示範展示了該系統,類人機器人成功取回了一個零食包裹,並在樓梯和電梯中自如導航,解開包裝箱並將物品存放在抽屜中。根據 Flexion 的説法,Reflect v1.0 整合了任務控制、運動規劃、全身控制和運行時軟件,透過強化學習將內部 16 步驟任務的完成率從 38% 提升至 90%。
最近,盛書科技也推出了 Motubrain,這是一個統一的人工智能模型,結合了感知、推理和行動,為機器人提供通用的大腦。
Reflect v1.0 提升了類人機器人的自主性
Reflect v1.0 是一個旨在使類人機器人能夠在為人類設計的環境中自主完成長期多步驟任務的機器人智能平台。該公司表示,這個平台結合了先進的推理、感知、運動規劃和全身控制,使機器人能夠在執行過程中不需人為幹預地完成複雜任務。為了展示該系統,Flexion 指派一個類人機器人執行一個自然語言指令:取回送到大樓的零食包裹,使用樓梯和電梯運送,解開包裝並將內容物放入指定的抽屜中。
該機器人成功自主完成了任務,在多個樓層間導航,與門和電梯互動,使用工具打開包裝,存放物品,並在遇到意外情況時進行調整。
根據 Flexion 的説法,長期自主性仍然是機器人技術中最大的挑戰之一,因為即使是高度可靠的導航、操控和感知系統,在多個連續任務中出現錯誤時也可能會累積故障。Reflect v1.0 通過整合一個自定義的視覺語言模型(VLM)來解決這一問題,該模型充當任務控制器,持續監控進展,對環境進行推理,並在必要時重新規劃。該平台將這個任務控制器與運動層結合,運用基於現實世界數據訓練的視覺語言行動模型以及強化學習技能。
這些組件將視覺觀察轉換為導航、物體操控和環境互動,同時實時的全身控制器在整個任務中保持平衡、穩定和精確的動作。
Flexion 將專注於提升機器人的技能多樣性
一個優化的運行時系統管理通信、低延遲推斷、安全監控和多設備之間的過程協調。Reflect v1.0 的一個關鍵特徵是其使用自然語言指令,而非特定任務的編程。用户可以通過改變提示輕鬆修改任務,使機器人能夠執行不同的任務,甚至在任務進行中接收更新指令。Flexion 表示,強化學習顯著提高了平台的可靠性。在一次內部評估中,經過監督微調的模型在 16 步驟任務中僅達到 38% 的端到端完成率。
經過在系統多層面上應用強化學習後,完成率提升至 90%。該公司還強調了在操控和移動能力方面的進展。
接受 Reflect 訓練的機器人可以處理重量在 100 克至 3.5 千克之間的箱子,通過協調全身運動重新定位包裹,操作電梯,使用工具,反覆走樓梯,導航不平坦的地形,並在攜帶物品時避開動態障礙物。當發生失誤時,例如錯過抓取或物體移位,機器人可以在本地重試行動或使用其車載攝像頭的反饋重新規劃整體任務。儘管取得了進展,Flexion 承認 Reflect v1.0 仍然限於定義的任務分配,尚未提供通用自主性。
該公司表示,未來的發展將專注於擴展技能多樣性、改進失敗恢復、增強基於模擬的訓練,以及推進端到端任務推理,以便更廣泛地在現實世界中部署。

