這項成果象征著業(yè)界正朝著讓機器人了解視覺世界的未來更邁進了一步。今天,人類專家通常以一種相對較緩慢的兩步驟過程訓(xùn)練廠房中的機器人重復(fù)幾個動作,但這有時還需要人類編寫客制軟件。
Embodied Intelligence共同創(chuàng)辦人兼執(zhí)行長Peter Chen表示:「我們提供的工具并非編程每一步驟,而是證實機器人并不需要人類專家的協(xié)助……它也能從嘗試與錯誤中學(xué)習(xí)?!?/span>
「我們的機器人軟件并不限于固定的動作。當(dāng)今的機器人一遍又一遍地重復(fù)執(zhí)行相同的機械式任務(wù)。透過我們的軟件,能夠賦予機器人經(jīng)由攝影機真正『看』到的能力,并因而進行調(diào)整?!?/span>
除了更迅速且便宜地訓(xùn)練機器人之外,該軟件工具還為教授新的任務(wù)開啟了大門。例如,這套系統(tǒng)能教導(dǎo)機器人如何將線穿過機械組件。由于追蹤與編程彈性化對象極其復(fù)雜性,使得大多數(shù)計算機視覺系統(tǒng)都無法順利實現(xiàn)這一類的應(yīng)用。
Embodied Intelligence采用虛擬現(xiàn)實(VR)頭戴式裝置來訓(xùn)練機器人。目前使用的是HTC Vive頭戴式裝置及其動作控制器,但任何VR裝置都適用。
他說:「你可以看機器人『看』到什么了,并根據(jù)機器人『看』到的對象做決定,而機器人也會加以模仿。」
Peter Chen曾經(jīng)是美國加州大學(xué)柏克萊分校(UC Berkeley)的研究人員,他和其他2位研究人員在今年初發(fā)表其采用機器學(xué)習(xí)與VR連結(jié),教導(dǎo)機器人10項基本任務(wù)的實驗結(jié)果。「在進行3分鐘的VR展示中,機器人解決了以往可能需要由博士編寫算法的所有任務(wù)。」
該途徑使用了Google和Facebook等網(wǎng)絡(luò)巨擘用于辨識影像和其他任務(wù)的相同深度神經(jīng)網(wǎng)絡(luò)技術(shù)。VR展示就像訓(xùn)練一樣,設(shè)定神經(jīng)網(wǎng)絡(luò)路徑或策略,并讓機器人能在執(zhí)行推論后加以改善。