應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊個(gè)人注冊登錄

蘋果創(chuàng)新技術(shù),人形機(jī)器人訓(xùn)練邁向低成本高效率

2025-05-22 09:10 IT之家
關(guān)鍵詞:蘋果人形機(jī)器人

導(dǎo)讀:科技媒體 AppleInsider 5 月 21 日發(fā)布博文,報(bào)道稱蘋果公司最新披露 PH2D 方法,結(jié)合人類教練和機(jī)器人示范者訓(xùn)練人形機(jī)器人,讓其獲得更高效的學(xué)習(xí)效果。

  科技媒體 AppleInsider  5 月 21 日發(fā)布博文,報(bào)道稱蘋果公司最新披露 PH2D 方法,結(jié)合人類教練和機(jī)器人示范者訓(xùn)練人形機(jī)器人,讓其獲得更高效的學(xué)習(xí)效果。

  蘋果公司于本周三發(fā)布《Humanoid Policy ~ Human Policy》研究論文,直指傳統(tǒng)訓(xùn)練方法的不足,提出了一種可擴(kuò)展且成本效益高的新方案,稱為“PH2D”(Physical Human-Humanoid Data)。

  蘋果公司在專利中指出,傳統(tǒng)人形機(jī)器人訓(xùn)練依賴機(jī)器人示范者,過程被描述為“勞動(dòng)密集型”,且需要昂貴的遠(yuǎn)程操作數(shù)據(jù)采集。

  援引博文介紹,蘋果的新方法結(jié)合人類教練和機(jī)器人示范者,利用改造后的消費(fèi)級設(shè)備,制作訓(xùn)練素材。

  例如,Apple Vision Pro 頭顯被調(diào)整為僅使用左下角攝像頭進(jìn)行視覺觀察,配合 ARKit 技術(shù)獲取 3D 頭部和手部姿態(tài)數(shù)據(jù);改造后的 Meta Quest 頭顯搭載 mini ZED 立體攝像頭,成為低成本訓(xùn)練工具。

  人類教練通過這些設(shè)備記錄手部操作,包括抓取、抬起物體和倒液體等動(dòng)作,錄制過程中還提供語音指導(dǎo),視頻被放慢后用于機(jī)器人訓(xùn)練。

  蘋果為此還開發(fā)了名為“Human-humanoid Action Transformer”(HAT)的模型,能夠同時(shí)處理人類教練和機(jī)器人示范者生成的數(shù)據(jù)。

  這一模型構(gòu)建了一個(gè)通用的策略框架,相較于僅使用真實(shí)機(jī)器人數(shù)據(jù)的訓(xùn)練方式,表現(xiàn)出更好的泛化能力和穩(wěn)健性。研究顯示,這種結(jié)合訓(xùn)練策略在特定任務(wù)(如垂直抓取物體)中,效果優(yōu)于單一機(jī)器人示范者訓(xùn)練。

  蘋果的研究表明,這種結(jié)合訓(xùn)練方式不僅成本效益高,還能顯著提升機(jī)器人表現(xiàn)。盡管目前僅展示了機(jī)器人燈原型,但據(jù)傳蘋果正在研發(fā)面向終端消費(fèi)者的移動(dòng)機(jī)器人,可執(zhí)行家務(wù)和簡單任務(wù)。