当前位置: 北京软件外包公司 » 资讯中心 » 软件技术 » 一种改善机器人抓取物体方式的深度学习技术

一种改善机器人抓取物体方式的深度学习技术

发表于:2023-08-24 16:06 来源:北京软件开发公司宜天信达 点击:
大多数成年人天生就能够拾取周围环境中的物体,并以方便使用的方式握住它们。例如,当拿起炊具时,他们通常会从不会放入烹饪锅或平底锅的一侧抓起。
另一方面,机器人需要接受培训,了解如何在完成不同任务时最好地拾取和握住物体。这通常是一个棘手的过程,因为机器人也可能会遇到以前从未遇到过的物体。
波恩大学自主智能系统 (AIS) 研究小组最近开发了一种新的学习流程,以提高机械臂操纵物体的能力,从而更好地支持其实际使用。他们的方法在预印本服务器arXiv上发表的一篇论文中介绍,可能有助于开发能够更有效地处理手动任务的机器人助手。
进行这项研究的研究人员之一德米特罗·帕夫利琴科 (Dmytro Pavlichenko) 告诉 Tech Xplore:“如果一个物体可以使用,那么它就具有功能性的抓握,例如:将食指放在钻头的扳机上。” “这种特定的抓握可能并不总是可以实现,因此需要进行操作。在本文中,我们讨论了用拟人手进行灵巧的预抓握操作。”
Pavlichenko 和合著者 Sven Behnke 最近发表的论文建立在 AIS 小组之前的研究成果的基础上,特别是在 2019 年多伦多 IEEE-RAS 国际人形机器人会议上发表的论文。作为过去研究的一部分,该团队开发了一种复杂的方法,用于双臂机器人重新抓取物体,该方法依赖于多个复杂的手工设计组件。
“我们新论文的动机是用神经网络取代如此复杂的管道,”帕夫利琴科解释道。“这降低了复杂性并消除了硬编码的操作策略,从而提高了方法的灵活性。”
研究人员在新论文中介绍的简化预掌握操作方法依赖于深度强化学习,这是一种高性能且众所周知的训练人工智能算法的技术。使用这种技术,该团队训练了一个模型,使其能够在抓取物体之前灵巧地操纵物体,确保机器人最终完全按照要求以有效的方式握住它们。
帕夫利琴科说:“我们的模型学习利用多组件密集奖励函数,该函数激励通过手指与物体交互使物体更接近给定的目标功能掌握。” “与基于 GPU 的模拟 Isaac Gym 相结合,可以快速完成学习。”
到目前为止,研究人员在名为 Isaac Gym 的模拟环境中评估了他们的方法,发现它取得了非常有希望的结果。在最初的测试中,他们的模型允许模拟机器人学习如何移动手中形状清晰的物体,最终找出操纵它们的最佳方法,而无需人类演示。
值得注意的是,Pavlichenko 和他的 Behnke 提出的学习方法可以很容易地应用于各种机器人手臂和手,同时还支持操纵大量不同形状的物体。未来,它可以在各种物理机器人上部署和测试。
帕夫利琴科说:“我们证明,使用一台计算机经过几个小时的训练时间来学习复杂的类人动态行为是可能的。” “我们未来的研究计划包括将学习模型带入现实世界,在真实机器人上实现类似的性能。这通常非常具有挑战性,因此我们预计可能需要在真实机器人上进行额外的学习步骤,以实现在线学习。缩小模拟与真实的差距。”