調(diào)制雞尾酒的機(jī)器人
機(jī)器人巴克斯特
機(jī)器人在現(xiàn)代制造業(yè)上發(fā)揮著不可替代的作用,然而,更安全、更便宜特別是更智能的機(jī)器人還是供不應(yīng)求。
隨著材料科學(xué)、計(jì)算機(jī)科學(xué)、大腦科學(xué)等領(lǐng)域的快速發(fā)展,機(jī)器人雖然距離科幻電影中的形象還相去甚遠(yuǎn),但隨著“學(xué)習(xí)”能力的不斷提升,開(kāi)發(fā)和拓展機(jī)器人與現(xiàn)實(shí)世界互動(dòng)的科技實(shí)踐,卻無(wú)時(shí)不刻震撼著你我的眼球。雖然,每一次學(xué)習(xí)都只進(jìn)步了一點(diǎn)點(diǎn),但正是這“一點(diǎn)點(diǎn)”的進(jìn)步,終將匯聚成未來(lái)的智能世界。
美國(guó)《麻省理工技術(shù)評(píng)論》10月份以來(lái)發(fā)布了幾篇有關(guān)機(jī)器人學(xué)習(xí)能力新動(dòng)向的文章,或許對(duì)機(jī)器人發(fā)燒友來(lái)說(shuō),是個(gè)有趣的、跟蹤最新技術(shù)方向的重要參考。
“自學(xué)”抓取多種物品
一般用途機(jī)器人的目標(biāo)之一,就是與日常生活中的物品以智能的方式互動(dòng),但是機(jī)器人的抓取能力實(shí)在差到令人尷尬。讓機(jī)器人撿起一個(gè)電視遙控器、一瓶水或者一個(gè)玩具槍,它都會(huì)無(wú)休止地去摸索,除非再編制一個(gè)讓它在特定環(huán)境下?lián)炱鹛囟ㄎ锲返某绦颉?
這與人類抓取東西的能力形成鮮明對(duì)比。一個(gè)人類嬰兒能夠在最混亂和非結(jié)構(gòu)化的環(huán)境下,快速學(xué)會(huì)抓取特定的物品。
那么,機(jī)器人能像嬰兒那樣通過(guò)反復(fù)試驗(yàn)和糾錯(cuò)來(lái)學(xué)習(xí)抓握嗎?
如今,卡耐基梅隆大學(xué)的里瑞爾·平托和阿波西納威·敢普塔證明了這種可能性。他們?yōu)槊麨榘涂怂固氐臋C(jī)器人裝載了深度學(xué)習(xí)功能,讓它在堆滿了一桌子的日常物品中,像嬰兒那樣坐在桌子前的高椅上自己學(xué)習(xí)。
巴克斯特是一個(gè)現(xiàn)代化的兩臂工業(yè)機(jī)器人,被設(shè)計(jì)成可在工廠車間環(huán)境下執(zhí)行重復(fù)性任務(wù)。它的每個(gè)胳膊都由一個(gè)標(biāo)準(zhǔn)的兩指平行爪和一個(gè)能讓機(jī)器人看清楚去抓什么的高清攝像頭,它還有一個(gè)微軟Kinect傳感器,提供一覽無(wú)余的視角。
平托和敢普塔為巴克斯特編程,通過(guò)與其他“鄰居”隔離的方式單獨(dú)抓取一個(gè)物品,然后在桌子上隨機(jī)找到一個(gè)點(diǎn),讓機(jī)器人的兩指平行爪旋轉(zhuǎn)一定的角度后直接抓取這個(gè)物品。機(jī)器人隨后會(huì)舉起胳膊、通過(guò)力量傳感器來(lái)明確抓握是否已經(jīng)成功,這個(gè)過(guò)程重復(fù)188次,每次轉(zhuǎn)換的角度是10度。
為了讓機(jī)器人更好地學(xué)習(xí),平托和敢普塔在巴克斯特的桌子前面放了很多物品,并讓它獨(dú)自在那里一呆就是10個(gè)小時(shí),中間不許人類干涉。如果機(jī)器人將物品掉落在地板上,桌面上還有很多替代的物品可以供其不間斷地練習(xí)。
巴克斯特的深度學(xué)習(xí)方法非常標(biāo)準(zhǔn),研究人員為它裝載了一個(gè)常規(guī)的神經(jīng)網(wǎng)絡(luò),能夠在學(xué)習(xí)抓握之前具備一些基本的對(duì)象識(shí)別技能。然而,仍有兩個(gè)網(wǎng)絡(luò)層面需要用于隨機(jī)抓取經(jīng)驗(yàn)的學(xué)習(xí)。
研究團(tuán)隊(duì)利用第二個(gè)學(xué)習(xí)層面來(lái)改進(jìn)巴克斯特的技能。在選取了一些基本的物品之后,他們提供給巴克斯特一些新的東西,里面有它見(jiàn)過(guò)的,還有對(duì)它來(lái)說(shuō)全新的物件。
超過(guò)700個(gè)小時(shí)后,巴克斯特對(duì)150種物品嘗試了5萬(wàn)次抓?。òㄎ闯晒Φ淖ト。?。這些物品包括電視遙控器、很多不同的塑料玩具,還有一些大小類似的物品。這讓巴克斯特可以預(yù)測(cè)出是否能抓取成功的幾率達(dá)到80%。
像使巴克斯特這樣與世界產(chǎn)生互動(dòng)的有趣研究將產(chǎn)生重要的影響。關(guān)鍵之處是,巴克斯特像人那樣很容易就適應(yīng)了雜亂的相對(duì)沒(méi)有規(guī)矩的環(huán)境。更重要的是,抓握物品的技能基本上是靠自學(xué)完成的。
當(dāng)然了,巴克斯特和它的神經(jīng)網(wǎng)絡(luò)要像嬰兒那樣靈活自如還有很長(zhǎng)的路要走。下一步需要學(xué)的技能是學(xué)習(xí)抓握的力度,這樣在拿到脆弱的物品時(shí)不至于將之毀于一旦。
可能最終對(duì)巴克斯特的測(cè)試會(huì)是挑戰(zhàn)牙膏——將豆粒大小的牙膏擠在牙刷上。畢竟,這是人類從小要學(xué)會(huì)的很重要的一件事情。
看視頻學(xué)會(huì)調(diào)制雞尾酒
工業(yè)機(jī)器人要執(zhí)行一個(gè)復(fù)雜的新任務(wù),需要花上數(shù)周時(shí)間來(lái)重新編程,這讓現(xiàn)代制造業(yè)生產(chǎn)線的重組變得十分昂貴和緩慢。
如果機(jī)器人能夠在勝任新工作之前看著別人先做一遍,整個(gè)進(jìn)程可能會(huì)用“突飛猛進(jìn)”來(lái)形容。這是美國(guó)馬里蘭大學(xué)執(zhí)行的一個(gè)項(xiàng)目中的“點(diǎn)子”,他們正在教育機(jī)器人成為“勤勉的學(xué)生”。
馬里蘭大學(xué)自主性、機(jī)器人與認(rèn)知實(shí)驗(yàn)室的楊葉舟(音)說(shuō):“我們叫它‘機(jī)器人培訓(xùn)學(xué)院’。我們請(qǐng)專家給機(jī)器人演示一遍任務(wù),并讓機(jī)器人按照任務(wù)的流程完成大部分工作,然后微調(diào)一下完成任務(wù)?!?
在圣路易斯召開(kāi)的一次相關(guān)會(huì)議上,研究人員展示了一個(gè)能調(diào)制雞尾酒的機(jī)器人,正是用了上述方法完成了調(diào)制任務(wù)。這個(gè)擁有兩個(gè)工業(yè)化機(jī)械手臂的家伙來(lái)自波士頓一家名為“重新思考機(jī)器人”的公司。一個(gè)人從幾個(gè)瓶子中倒出液體后在一個(gè)小壇子里混合成一杯飲品,機(jī)器人觀看了整個(gè)過(guò)程,復(fù)制下所有的動(dòng)作,關(guān)鍵是,它抓起瓶子的順序是正確的。
這需要訓(xùn)練一個(gè)計(jì)算機(jī)系統(tǒng)與特殊的機(jī)器人動(dòng)作相適應(yīng)。該研究團(tuán)隊(duì)最近的一篇論文指出,一個(gè)機(jī)器人學(xué)會(huì)選取不同的物品,需要使用兩套不同的系統(tǒng)來(lái)觀看數(shù)千遍的教學(xué)視頻,一個(gè)系統(tǒng)是學(xué)習(xí)如何識(shí)別不同的物品,另一個(gè)系統(tǒng)是明確不同類型的抓握動(dòng)作。
觀看數(shù)千遍的教學(xué)視頻可能聽(tīng)起來(lái)很費(fèi)時(shí)間,但是學(xué)習(xí)的過(guò)程比重新對(duì)機(jī)器人編程效率高得多,重要的是,它很容易讓機(jī)器人“上手”新任務(wù)。用于抓握動(dòng)作的學(xué)習(xí)系統(tǒng)包含了先進(jìn)的人工神經(jīng)網(wǎng)絡(luò),這種技術(shù)近幾年取得了快速發(fā)展,現(xiàn)在正如火如荼地被用于開(kāi)發(fā)多種類型的機(jī)器人。
研究人員正在向包括電子商務(wù)、汽車制造商在內(nèi)的幾家制造業(yè)公司推介它們的學(xué)習(xí)機(jī)器人,看是否能將這個(gè)新技術(shù)應(yīng)用于工業(yè)生產(chǎn)。這些公司也曾為了拓展機(jī)器人工作任務(wù)找過(guò)工程師重新對(duì)機(jī)器人編程,但大多數(shù)都需要一個(gè)半月或者更長(zhǎng)的時(shí)間才能搞定。楊葉舟說(shuō):“用我們的方法至少可以節(jié)省一半時(shí)間。”
該項(xiàng)目反映了機(jī)器人行業(yè)的兩大發(fā)展趨勢(shì),一個(gè)是找到機(jī)器人學(xué)習(xí)的新方法,另一個(gè)是機(jī)器人可最大程度地以人類工作的方式進(jìn)行操作。
機(jī)器人也用學(xué)習(xí)軟件
機(jī)器人技術(shù)的迅速推進(jìn),部分原因在于硬件,包括計(jì)算機(jī)芯片、傳感器和執(zhí)行器的研究進(jìn)展,但是軟件也同樣推進(jìn)了技術(shù)進(jìn)步。例如,開(kāi)源的機(jī)器人操作系統(tǒng)讓工程師為機(jī)器人增加新的技能變得更容易,這樣就不必要都從零開(kāi)始。
小孩子在蹣跚學(xué)步的時(shí)候能快速識(shí)別一頓美味或者避免抓住帶刺的東西,近日發(fā)布的一個(gè)軟件能讓機(jī)器人通過(guò)經(jīng)驗(yàn)學(xué)習(xí)而非編輯程序,也能如此智能。
先進(jìn)的機(jī)器學(xué)習(xí)軟件,比如Brain OS能夠讓機(jī)器人看到更先進(jìn)的技能,也能夠讓機(jī)器人學(xué)習(xí)更為先進(jìn)的技術(shù)經(jīng)驗(yàn)。
Brain OS由一家位于美國(guó)圣地亞哥的移動(dòng)芯片制造商高通公司支持的“大腦公司”開(kāi)發(fā)。這樣的軟件最終讓機(jī)器人更容易被使用。使用Brain OS的用戶不需要編寫新的代碼或者訪問(wèn)圖形用戶界面,就能輕松地訓(xùn)練機(jī)器人做一些簡(jiǎn)單的任務(wù),比如朝著特定的物體移動(dòng)。
對(duì)于機(jī)器人來(lái)說(shuō),在復(fù)雜的、不斷變換的環(huán)境中穩(wěn)定地工作是非常困難的事情,這就是要將學(xué)習(xí)能力變成可靠途徑的一個(gè)重要原因。一些商業(yè)化的機(jī)器人已經(jīng)能夠進(jìn)行簡(jiǎn)單的學(xué)習(xí),但是Brain OS軟件包含了一系列為機(jī)器人學(xué)習(xí)提供的工具,可以讓機(jī)器人工程師更容易進(jìn)入這個(gè)軟件庫(kù),來(lái)為機(jī)器人獲取諸如對(duì)象識(shí)別、導(dǎo)航和操作任務(wù)的程序。
去年在波士頓舉辦的機(jī)器人會(huì)議上,大腦公司展示了這款軟件,當(dāng)時(shí)該公司用一個(gè)紅色原型機(jī)器人拼裝成一個(gè)由兩只攝像頭做眼睛的賽格威電動(dòng)平衡車,它把一個(gè)對(duì)象展示給機(jī)器人,然后機(jī)器人能夠跟隨物體,不離不棄。
Brain OS利用的學(xué)習(xí)能力包括給能模擬神經(jīng)元和突觸的虛擬網(wǎng)絡(luò)提供信息,然后提供正面或者反面的反饋,這個(gè)過(guò)程被稱為“監(jiān)督學(xué)習(xí)”。近年來(lái)這種學(xué)習(xí)方法因非常有效而備受矚目。
大腦公司的執(zhí)行副總裁托德·希爾頓在一份聲明中說(shuō),機(jī)器學(xué)習(xí)軟件大多數(shù)針對(duì)學(xué)術(shù)研究人員而不是工業(yè)工程師?!癇rain OS通過(guò)提供接近原型的、可商業(yè)化的機(jī)器人應(yīng)用中央技術(shù)框架來(lái)解決這個(gè)問(wèn)題”。
大腦公司還發(fā)布了一個(gè)由高通公司開(kāi)發(fā)的被稱為bStem(腦干的簡(jiǎn)稱)的軟件版芯片。該芯片可以用來(lái)設(shè)計(jì)模擬大腦工作的方式,并行存儲(chǔ)和處理數(shù)據(jù)。這樣的“神經(jīng)形態(tài)”芯片可以被用來(lái)高效運(yùn)行模擬神經(jīng)網(wǎng)絡(luò),高通公司也是希望將這種技術(shù)商業(yè)化的公司之一。(記者 房琳琳 綜合外電)