產(chǎn)品分類 / Product Categories
聯(lián)系我們 / Contact Us
江西丹巴赫機(jī)器人股份有限公司服務(wù)熱線:400-697-1188
聯(lián)系電話:0791-88133135
公司傳真:0791-88221576
手機(jī)號(hào)碼:18607918385
公司郵箱:sale@danbahe.cn
公司地址:南昌市高新區(qū)創(chuàng)新三路811號(hào)
當(dāng)機(jī)器人擁有了好奇心
DANBACH ROBOT
在場關(guān)于人工智能的轉(zhuǎn)折中,計(jì)算機(jī)科學(xué)家對(duì)機(jī)器進(jìn)行編程,使其變得具有好奇心——能自己探索周圍環(huán)境并且為了學(xué)習(xí)而學(xué)習(xí)。這種新方法可使機(jī)器人比現(xiàn)在學(xué)習(xí)得更快。有朝日,它們甚至可能在形成假設(shè)和推動(dòng)已知科學(xué)向前發(fā)展方面超越人類科學(xué)家。
“發(fā)展好奇心是智能的核心問題。”在美國布朗大學(xué)掌管智能機(jī)器人實(shí)驗(yàn)室的計(jì)算機(jī)科學(xué)家GeorgeKonidaris介紹說,“當(dāng)你不確定你的機(jī)器人將來要做什么時(shí),使其具有好奇心將會(huì)非常有用。”
多年以來,科學(xué)家直在開發(fā)針對(duì)好奇心的算法,但復(fù)制人類的求知欲是個(gè)難題。比如,大多數(shù)方法不能評(píng)估智能機(jī)器人在看見某個(gè)事物前預(yù)測(cè)其是否有趣方面存在的差距。(人類有時(shí)能通過封面判斷本書是否有趣)
目前在英國倫敦谷歌深度思維公司就職的計(jì)算機(jī)科學(xué)家ToddHester希望做得更好。“我在尋找使計(jì)算機(jī)更加聰明地學(xué)習(xí)并且像人類樣進(jìn)行探索的方法。”Hester表示,“不是探索所有事情,也不是隨意進(jìn)行探索,而是嘗試著更加聰明地做些事情。”
為此,Hester和得克薩斯大學(xué)計(jì)算機(jī)科學(xué)家PeterStone開發(fā)了種名為TEXPLORE-VENIR、依賴于強(qiáng)化學(xué)習(xí)技術(shù)的新算法。在強(qiáng)化學(xué)習(xí)中,程序會(huì)嘗試些事情。如果個(gè)舉動(dòng)使其離某個(gè)較終目標(biāo)(比如迷宮的盡頭)更近步,它會(huì)收到個(gè)小小的獎(jiǎng)勵(lì)并且更有可能在將來再次嘗試這操作。深度思維公司利用強(qiáng)化學(xué)習(xí),使程序通過隨機(jī)試驗(yàn)掌握雅達(dá)利游戲和圍棋游戲的玩法。不過,和其他具有好奇心的算法樣,TEXPLORE-VENIR同樣設(shè)置了個(gè)內(nèi)在目標(biāo)。如果它理解了些新事物,就會(huì)獎(jiǎng)勵(lì)自己,即便這些知識(shí)并未使其離較終目標(biāo)更近步。
隨著TEXPLORE-VENIR不斷學(xué)習(xí)并且構(gòu)建起關(guān)于的模型,它會(huì)因發(fā)現(xiàn)了和此前見到的事物不樣的信息而獎(jiǎng)勵(lì)自己。比如,在幅地圖上發(fā)現(xiàn)遙遠(yuǎn)的地方,或者在烹調(diào)用的程序上發(fā)現(xiàn)具有異國情調(diào)的食譜。“它們是完全不同的學(xué)習(xí)和探索類型。”Konidaris表示,“對(duì)它們進(jìn)行平衡真的很重要。我喜歡這篇文章的地方在于它同時(shí)做到了兩點(diǎn)。”
Hester和Stone在兩個(gè)場景中測(cè)試了他們的方法。先是個(gè)含有圈4個(gè)房間的虛擬迷宮,房間則由鎖著的門連接起來。機(jī)器人(僅是個(gè)計(jì)算機(jī)程序)不得不找到鑰匙,將其撿起來,然后利用它打開門上的鎖。每通過扇門,機(jī)器人會(huì)獲得10分,并且擁有3000步來獲得更高的得分。如果研究人員先讓機(jī)器人僅在TEXPLORE-VENIR的指導(dǎo)下摸索1000步,它在3000步的測(cè)試階段會(huì)平均獲得約55分。如果機(jī)器人利用其他開發(fā)好奇心的算法進(jìn)行此類探索,它在測(cè)試階段的得分從0到35分不等,除了利用種被稱為R-Max的算法。后者也能讓機(jī)器人獲得約55分。在另個(gè)不同的設(shè)定中,機(jī)器人不得不同時(shí)探索和穿過門。TEXPLORE-VENIR獲得了約70分,R-Max獲得了約35分,其他算法獲得的分?jǐn)?shù)則不到5分。研究人員在6月出版的《人工智能》雜志上報(bào)告了這結(jié)果。
隨后,研究人員利用實(shí)體機(jī)器人測(cè)試了他們的算法。這是個(gè)被稱為Nao的人形玩具。在3項(xiàng)單獨(dú)的任務(wù)中,半米高的機(jī)器人需要擊打鐃鈸、用手將粉色膠帶舉到眼前或者按下腳上的按鈕,從而獲得分?jǐn)?shù)。在每項(xiàng)任務(wù)中,它有200步來獲得分?jǐn)?shù),但在這之前會(huì)有400步來摸索。這要么是隨機(jī)進(jìn)行的,要么利用TEXPLORE-VENIR。每種方法平均開展了13次試驗(yàn)。相較于隨機(jī)摸索,在利用TEXPLORE-VENIR進(jìn)行探索后,Nao在找到粉色膠帶上做得更好,并且在13次試驗(yàn)中,有7次按下了按鈕。但在隨機(jī)探索后,沒有次按下。通過自身和周圍環(huán)境開展半結(jié)構(gòu)化的試驗(yàn),TEXPLORE-VENIR做好了充分準(zhǔn)備執(zhí)行被分配的任務(wù),就像嬰兒在學(xué)習(xí)爬之前舞動(dòng)自己的四肢樣。
在做家務(wù)、設(shè)計(jì)高效的生產(chǎn)流程或者為疾病尋求治療方案時(shí),具有好奇心的機(jī)器人會(huì)表現(xiàn)出靈活的行為。Hester表示,下步將利用深度神經(jīng)網(wǎng)絡(luò),即以大腦結(jié)構(gòu)為模型的算法更好地確定要探索的新領(lǐng)域。而這順便也能使Hester的探索更進(jìn)步:“我們能否制造像孩子樣學(xué)習(xí)的機(jī)器人呢?”
上一篇:接下來國產(chǎn)工業(yè)機(jī)器人要怎么走?
下一篇:“云”將無處不在 人工智能深入各行各業(yè)