赫特福德大学开发新算法帮助机器人“凭直觉行事”

盖世汽车讯据外媒报道，赫特福德大学（University of Hertfordshire）的研究人员开发出新型算法，使机器人可以更直观地发挥作用，即根据环境导引做出决策。

图片1.png

（图片来源：赫特福德大学）

这项研究的原理是，机器人代理通过算法创建自己的目标。该算法首次将不同目标设定方法整合至一个与物理学直接相关的概念中，并进一步实现计算透明化，以便其他人进行研究和采用。该算法的原理与著名的混沌理论（chaos theory）有关，因为这种方法使代理“能够掌握系统动力学的混沌现象。”

相关论文发表在期刊《PRX Life》上。研究人员探索机器人的“动机模型（motivation models）”，即使在没有明确奖励信号的情况下，也能模仿人类和动物的决策过程。

该研究通过人工智能（AI）公式计算出一种方法，使机器人可以在没有直接指令或人类输入的情况下决定其未来行动。计算机科学教授Daniel Polani表示：“在应用意义上，举例来说，这可能意味着让机器人自己玩耍和操纵物体，而无需别人指示。通过鼓励更多的‘自然’行为和互动，可以增强机器人学习与人类和其他机器人互动的方式。这还有进一步的应用，例如半自主机器人在人类操作者无法到达的情况下的生存行为，比如在地下或星际位置。”

在人类和动物中，有一种理论假设是存在一种“内在动机”，即行为仅由生物与其环境之间的相互作用驱动，而不是由特定的习得奖励（如食物）驱动。这项研究成功地将这一假设转化为机器人代理可以使用的理论。Polani教授表示：“我们在机器人中实施了一种机制，类似于帮助人类和动物不凭借先前经验来解决新问题的机制。”研究人员预计，这项工作为未来开发类人机器人奠定了基础，以使其具有更直观的流程，从而帮助实现拥有与人类相似的决策过程的更复杂的机器人。

这项研究的理论基础是“赋权最大化（empowerment maximization）”，赫特福德研究人员已为此进行了多年开发。这意味着通过拓展未来的科技成果范围，机器人也可以在更长远的未来拥有更好的选择。重要的是，这种方法取代并可能消除传统的奖励系统（如食物信号）。

虽然赋权最大化理论富有前景，但尚未得到充分理解或广泛应用。以前的研究大多依赖于仿真，而对复杂系统和理论所需的信息进行精细计算仍面临挑战。这项创新研究旨在解释为什么赋权基动机可以创建类似于生物体的行为，从而促进实现更多具有内在动机的机器人。此外，这为计算这些动机提供了明显改进的方法。

研究人员下一步将利用这项突破性算法，让机器人更多地了解世界，从而发展其直接学习能力，识别和磨练新技能，以在现实世界场景中发挥价值。

标签：凭直觉行事机器人

免责声明：本站登载此文仅出于信息分享，并不意味着赞同其观点及其描述，不承担侵权行为的连带责任。如涉及版权等问题，请与我们联系（联系QQ：26887486），我们将及时删除处理。
本文链接：https://www.zhongzhouauto.com/article/41/40787.html