JueYing
Yang et al

对于人类而言,在面对陌生情况时切换不同技能来进行尝试、应对似乎是一种本能,但对机器人来说这却是一项不小的挑战。此前大家虽然也看到过它们能跑能跳,但这基本上都是基于预先设定好的程序,一旦到了软件预设的范围以外其就很难随机应变了。为了改善这种情况,浙江大学和爱丁堡大学的研究者开发出了一套新的 AI 加强式学习方案。它能利用所谓的「多专家」系统,让浙大的「绝影」机器狗掌握自行应对陌生情况的能力。

JueYing
Yang et al

根据团队发布在 Science Robotics 期刊上的论文,目前这套系统是由八个 AI「专家」组成。每个「专家」都会训练一项基本技能,比如说行走、转向、保持平衡等等。在「专家」掌握基础技能后研究者会以不同的搭配来进行进一步的组合训练,这个时候就需要引入额外的门控神经网络,它的角色就类似于所有「专家」的总指挥。

在遇到陌生情况时,门控网络会融合八个「专家」输入的数据,然后进行协调调度,最终决定以什么样的技能组合来做出适应性的行为。在测试过程中,研究者先是以虚拟机器人在电脑上进行了模拟,后续他们也将软件装到了一台「绝影」的工程机上。从动图中你可以看到,在以不同方式倒地之后,机器人最终都会学着自己站立起来。

JueYing
Yang et al

在接受 Wired 采访时,论文作者之一的爱丁堡大学信息学院助教李智彬表示这项研究的目的是创造出「在面对不同陌生情况时懂得将技能融会贯通、随机应变的进阶智能机器」。按照他的说法,现阶段最大的挑战之一是需要降低模拟机器人训练所需要的算力,在达成这一点后该方案才能具备真正的实用前景。