在不远的将来,
机(jī)器人可能会作为最后一英里的运输(shū)工具(jù)被派往你家门口,如果他们能找(zhǎo)到门(mén)的话(huà),就可(kě)以把你(nǐ)的(de)外卖订单、包裹或餐盒订购单放(fàng)到你家门(mén)口(kǒu)。
机器人导(dǎo)航(háng)的(de)标准方(fāng)法包括预先绘制一个区域的地图,然(rán)后使(shǐ)用算法引导机器(qì)人朝向地图上的特定目标(biāo)或GPS坐标。虽然这种方法对于探索(suǒ)特定环境(如特定建筑的布(bù)局或(huò)计划的障碍路线)可能是有意义的,但在最后一(yī)英里交(jiāo)付的(de)情况下,这种方法可能(néng)会变(biàn)得笨拙。

portant;" />
例如,想(xiǎng)象(xiàng)一下,公(gōng)司(sī)必须事(shì)先绘制机器人传送区域内每个邻居的(de)地图,包括(kuò)该邻居内每个房子的(de)配置以及每(měi)个房子(zǐ)前(qián)门的特定坐标(biāo),这个任务量(liàng)会让人(rén)崩溃。同样,这样(yàng)的任务额很难扩展到整个城市,特别是房屋的外观经(jīng)常(cháng)随着季节的变化而变化(羡慕国外)。绘制每间房子的地图也可能(néng)会遇(yù)到安全和隐私问题。
新技术
现(xiàn)在(zài)麻(má)省理(lǐ)工学院的工(gōng)程(chéng)师已经开发出一种导航方法,不需(xū)要事先绘制一(yī)个区域。相反,他们的方法使机器人能(néng)够利用环境中(zhōng)的线索规划到(dào)目(mù)的地的路线,这(zhè)可以用(yòng)一般(bān)的语(yǔ)义术语(yǔ)来描述,例如“前门”或“车库”,而(ér)不(bú)是地图(tú)上的(de)坐标。例如(rú),如果一个机器人接到指令,要把包裹送到某人的前门,它(tā)可(kě)能会从马路上开始,看到(dào)一条车(chē)道,经过训练(liàn),它认识到这条车道有可能通向人行道,而人行道又有可能通向(xiàng)前门。
这项新(xīn)技术(shù)可(kě)以大大减少机器人在识别目标之前探索(suǒ)一处房产的时间(jiān),而且它不依(yī)赖特定住宅的地(dì)图。麻省理(lǐ)工(gōng)学院机(jī)械工程(chéng)系的研究生迈(mài)克(kè)尔·埃弗雷特(tè)(Michael Everett)说(shuō):“我们不想把我们需要去的每一栋建筑(zhù)都绘(huì)制(zhì)成地图。”有了这项技术,我们希望在任何车道的尽头都能放下一个机器人,让它找到一扇门。”
埃(āi)弗雷特将在本周的智(zhì)能机器人和系统国际会议上介绍该技(jì)术的成果。这篇论文由(yóu)麻省(shěng)理(lǐ)工学院(yuàn)航空航(háng)天学教授乔纳森·豪斯(sī)(jonathan how)和福特汽车公司(ford motor company)的贾(jiǎ)斯汀·米勒(justin miller)共同(tóng)撰写,是“认知机器人最佳(jiā)论文”的最终入围(wéi)者(zhě)。
“对事物的感觉(jiào)”
近年来(lái),研究(jiū)人员致力于(yú)将自然(rán)的语义语言引(yǐn)入机器人系统,训(xùn)练机(jī)器人通(tōng)过语义(yì)标签(qiān)识别物体,这样他们就可(kě)以将(jiāng)一扇门视(shì)为一扇门,而(ér)不仅仅(jǐn)是一(yī)个实心的矩形障碍物。
埃弗雷特说:“现在我们有(yǒu)能力(lì)让机器人实(shí)时感知事物的(de)本质。”埃弗(fú)雷特、豪(háo)斯和(hé)米(mǐ)勒正在(zài)使用类似的(de)语义技术作为他们的新导航方(fāng)法的跳(tiào)板,它利用预先存在的算法从(cóng)视(shì)觉数据中(zhōng)提取特征以生成同一场景(jǐng)的新地图,从而(ér)用语义线索或上下文进(jìn)行分析。
在他们(men)的案例(lì)中,研究人(rén)员使用一种算法来(lái)建立机器人移动时的环境地图,使用每(měi)个物体的语义标签和深度图(tú)像这(zhè)种(zhǒng)算法称为语义SLAM(同时定位和映射)。虽然其他语义算(suàn)法使机器人能够识别和映射环境中的对象,但它(tā)们不允许(xǔ)机器人在导航新环境的同时(shí),在最有效(xiào)的路径上做(zuò)出决策,以到达语义(yì)目的地,如“前门”,霍(huò)华德说:“以(yǐ)前,探索(suǒ)只是把(bǎ)一个机(jī)器(qì)人扑通一声放下来(lái),对它说(shuō)‘走’,它(tā)会四处移动(dòng),虽然(rán)最终到达那里(lǐ),但(dàn)速度会很慢。”
去的代价
研究人员希望通过一(yī)个语义的、背景色的(de)世界来加速机器人的路径(jìng)规划。他们(men)开发了一种新(xīn)的“去代价估计器”,该算法将现有SLAM算(suàn)法创建的语义映射(shè)转换成(chéng)第(dì)二个映射,表示(shì)任何给定位置(zhì)接(jiē)近(jìn)目标(biāo)的可能性。
埃弗(fú)雷特说:“这是从一个图像到另一个图像的转换(huàn)中得到(dào)的灵感(gǎn),在(zài)这里你拍下(xià)一只猫的照片,让它看起来像一只(zhī)狗(gǒu)。”同样的想法也(yě)会在这里发生,以前你把一(yī)张看起来像世(shì)界(jiè)地(dì)图的图(tú)像,可以变成另一张看起来(lái)像世界(jiè)地图的图像,但现在是根据地(dì)图上不同点与(yǔ)最终目标的距离来着(zhe)色的。”
这个(gè)成本地图是彩色的,用灰度表(biǎo)示,把较暗的(de)区域表(biǎo)示为远离目标的位置,把(bǎ)较亮的(de)区域表示为接近(jìn)目标的区(qū)域。例如(rú),在(zài)语义地图(tú)中用黄色编码的人行道(dào),可(kě)能会被(bèi)cost-to-go算法转换为(wéi)新地图中(zhōng)较暗的(de)区域,而车(chē)道在接近前门时会逐渐变亮,这(zhè)是新地图中(zhōng)最亮的区域。
研究人员在Bing地图的卫(wèi)星图像上训练了这种新算法,这些图像包含来自(zì)一个城市(shì)和三个郊区(qū)的77栋(dòng)房屋。该系统将语义(yì)映射转(zhuǎn)换为代价映射,并(bìng)按照映射中较轻的区域映射出最有(yǒu)效的路径,以(yǐ)达到(dào)最终目标对(duì)于每个卫星图像,埃弗(fú)雷特都为典型(xíng)前院的上下文特(tè)征指定(dìng)语义标签和(hé)颜色,例如(rú)灰色表(biǎo)示前门,蓝色表示车道,绿色表示树篱。
在这个训练过程中,研究小组还(hái)对每幅(fú)图(tú)像应用了蒙版,以(yǐ)模拟机器(qì)人的相机(jī)在穿越院子时(shí)可能(néng)拥有的部(bù)分视图(tú)。“我(wǒ)们方法(fǎ)的一(yī)部分诀窍是(给系统)提供许多部分图(tú)像,”How解(jiě)释(shì)道。所(suǒ)以它必须弄清楚这些东西是如何相互关联的,这(zhè)正是这项(xiàng)工作得以稳健开展的部分原(yuán)因。”
然后,研究人(rén)员在训练(liàn)数据集之外的一(yī)所全(quán)新房屋(wū)的(de)图像模拟中(zhōng)测试(shì)了他们的方(fāng)法(fǎ),首(shǒu)先使用预(yù)先存在(zài)的SLAM算(suàn)法生成(chéng)语义图,然后(hòu)使用其新的成本估算(suàn)器生成第二(èr)张地图(tú)和(hé)通往目标(biāo)的路径(在这种情况(kuàng)下为前门)。
对比传统的导航算(suàn)法,该集团的“去发现(xiàn)前(qián)车门(mén)”新技术更高效与低成本,这种算法(fǎ)比不考虑(lǜ)上下文或语义的经典导航(háng)算法快189%,以往的(de)方法花费了过多(duō)的(de)步骤来探索不太可能接(jiē)近目(mù)标的领域。埃弗雷特说(shuō),研究结果(guǒ)说明了机器人是(shì)如何利用(yòng)上下文来有效地定位目标,即使是在不熟悉的、未映射的环境中。
埃弗(fú)雷特说:“即(jí)使一个机器人正在把一个包裹(guǒ)送到(dào)一个(gè)它从未去过的环境中(zhōng),也可能会有一些(xiē)线索和(hé)它看(kàn)到的其他地方一样。”所以,即便世(shì)界(jiè)的布局可能有(yǒu)点不同,但必然(rán)可能有一些共同点。”我(wǒ)们要(yào)做的只是让机器人发(fā)现和使用这些共通点!