【AI视野·今日Robot 机器人论文速览第六十六期】Tue, 31 Oct 2023

AI视野·今日CS.Robotics 机器人学论文速览
Tue, 31 Oct 2023
Totally 39 papers
👉上期速览✈更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

DEFT: Dexterous Fine-Tuning for Real-World Hand Policies
Authors Aditya Kannan, Kenneth Shaw, Shikhar Bahl, Pragna Mannam, Deepak Pathak
敏捷性通常被视为复杂操作的基石。人类能够用手执行一系列技能，从制作食物到操作工具。在本文中，我们研究了这些挑战，特别是在柔软、可变形物体以及复杂、相对较长时间范围的任务的情况下。然而，从头开始学习此类行为可能会导致数据效率低下。为了解决这个问题，我们提出了一种新颖的方法，即 DEFT DExterous Fine Tuning for Hand Policies，它利用人类驱动的先验，这些先验直接在现实世界中执行。为了改进这些先验，DEFT 涉及高效的在线优化过程。通过将基于人的学习和在线微调相结合，再加上软机器人手，DEFT 在各种任务中取得了成功，为通用灵巧操作建立了一条强大的、数据有效的途径。

Spatiotemporal Attention Enhances Lidar-Based Robot Navigation in Dynamic Environments
Authors Jorge de Heuvel, Xiangyu Zeng, Weixian Shi, Tharun Sethuraman, Maren Bennewitz
在动态室内环境中使用具有成本效益的硬件进行有远见的机器人导航需要使用轻便而可靠的控制器。因此，在没有明确对象跟踪的情况下，从传感器读数推断场景动态是行人预见性导航的关键方面。在本文中，我们介绍了一种基于 2D 激光雷达传感器读数的增强导航的时空注意力管道。该管道得到了一种新颖的激光雷达状态表示的补充，该表示强调动态障碍而不是静态障碍。随后，注意力机制实现了跨空间和时间的选择性场景感知，从而提高了动态场景中的整体导航性能。我们在不同的场景和模拟器中彻底评估了该方法，发现对未见过的环境具有良好的泛化性。

Large Trajectory Models are Scalable Motion Predictors and Planners
Authors Qiao Sun, Shiduo Zhang, Danjiao Ma, Jingzhe Shi, Derun Li, Simian Luo, Yu Wang, Ningyi Xu, Guangzhi Cao, Hang Zhao
运动预测和规划是自动驾驶中的重要任务，最近的工作已经转向基于机器学习的方法。挑战包括理解不同的道路拓扑、推理长期的交通动态、解释异构行为以及在大型连续状态空间中生成策略。受到大型语言模型通过模型扩展解决类似复杂性的成功的启发，我们引入了一种名为 State Transformer STR 的可扩展轨迹模型。 STR 通过将观察、状态和动作安排到一个统一的序列建模任务中，重新表述了运动预测和运动规划问题。通过简单的模型设计，STR 在这两个问题上始终优于基线方法。值得注意的是，实验结果表明，大型轨迹模型 LTM（例如 STR）通过表现出出色的适应性和学习效率来遵循缩放定律。定性结果进一步表明，LTM 能够在与训练数据分布显着不同的场景中做出合理的预测。

Non-parametric regression for robot learning on manifolds
Authors P. C. Lopez Custodio, K. Bharath, A. Kucukyilmaz, S. P. Preston
许多可用于机器人学习的工具都是针对欧几里得数据设计的。然而，机器人技术的许多应用涉及多种有价值的数据。一个常见的例子是方向，它可以表示为 3 x 3 旋转矩阵或四元数，其空间是非欧几里德流形。在机器人学习中，流形值数据通常通过将流形与合适的欧几里得空间相关联来处理，方法是嵌入流形或将数据投影到一个或多个切线空间上。这些方法可能会导致预测准确性较差和算法复杂。在本文中，我们提出了一种直接在流形内工作的内在回归方法。它涉及在流形上采用合适的概率分布，使其参数成为预测变量（例如时间）的函数，然后通过结合核的局部似然方法非参数地估计该函数。我们将该方法命名为核似然估计。该方法概念上很简单，并且通常适用于不同的流形。我们使用机器人应用中常见的三种不同类型的流值数据来实现它。

Rule-Based Lloyd Algorithm for Multi-Robot Motion Planning and Control with Safety and Convergence Guarantees
Authors Manuel Boldrer, Alvaro Serra Gomez, Lorenzo Lyons, Javier Alonso Mora, Laura Ferranti
本文提出了一种基于分布式规则的 Lloyd 算法 RBL，用于多机器人运动规划和控制。基于 Loyd 的基本算法 LB 的主要局限性涉及死锁问题和无法有效解决动态约束。我们的贡献是双重的。首先，我们展示 RBL 如何能够在不依赖机器人之间的通信、邻居控制输入或机器人之间的同步的情况下提供目标区域的安全性和收敛性。我们考虑了控制输入饱和的完整机器人和非完整机器人的情况。其次，我们表明，没有规则的基于 Lloyd 的算法可以成功地用作基于学习的方法的安全层，从而带来不可忽视的好处。

Deep Learning for Visual Navigation of Underwater Robots
Authors M. Sunbeam
本文旨在简要概述水下机器人视觉导航的深度学习方法。本文的范围包括采用深度学习方法的水下机器人视觉感知、可用的视觉水下数据集、模仿学习和用于导航的强化学习方法。此外，相关工作将被归类为水下机器人的模仿学习或深度学习范式，以明确当前情况下的训练方法。

Explaining the Decisions of Deep Policy Networks for Robotic Manipulations
Authors Seongun Kim, Jaesik Choi
深度策略网络使机器人能够学习行为，以端到端的方式解决现实世界中的各种复杂任务。然而，他们缺乏透明度来提供行动的理由。因此，这种黑盒模型通常会导致机器人在实际部署过程中可靠性低和破坏性行为。为了提高其透明度，重要的是通过考虑每个输入特征对确定给定动作的贡献程度来解释机器人行为。在本文中，我们通过输入归因方法对深层策略模型进行了显式分析，以解释每个输入特征如何以及在多大程度上影响机器人策略模型的决策。为此，我们提出了两种将输入归因方法应用于机器人策略网络的方法：1我们测量每个关节扭矩的重要性因子以反映电机扭矩对末端执行器运动的影响，2我们修改相关性传播方法以妥善处理深层政策网络中的负面输入和输出。

Scalable underwater assembly with reconfigurable visual fiducials
Authors Samuel Lensgraf, Ankita Sarkar, Adithya Pediredla, Devin Balkcom, Alberto Quattrini Li
我们提出了一种用于水下装配的可扩展的组合定位基础设施部署和任务规划算法。基于基础设施位置精度的不确定性模型，基础设施可以自主修改，以满足操纵任务的需要。我们的不确定性模型可以与多个设备的噪声特征相结合。对于任务规划问题，我们提出了一种基于层的聚类方法，一次完成一个集群的操作任务。我们采用可移动视觉基准标记作为基础设施，并采用自主水下航行器 AUV 来执行操纵任务。所提出的任务规划算法计算简单，我们在 AUV 上实现它，没有任何离线计算要求。

Considerations for the Control Design of Augmentative Robots
Authors Shivani Guptasarma 1 , Monroe Kennedy III 1 1 Stanford University
旨在增强人类能力的机器人系统通常需要使用半自主控制和人工传感，同时旨在增强用户做出决策和采取行动的能力。这项工作从文献中确定了有助于解决这一明显矛盾的原则和技术。

Knolling bot 2.0: Enhancing Object Organization with Self-supervised Graspability Estimation
Authors Yuhang Hu, Zhizhuo Zhang, Hod Lipson
建立在基于变压器的家用机器人执行敲门方法的最新进展的基础上，将分散的物品组织成整齐的排列的艺术。本文介绍了 Knolling bot 2.0。认识到堆积在一起的物体或物品所带来的挑战，这个升级的系统采用了自我监督的可抓性估计模型。如果对象被认为是不可抓取的，则在敲桌子之前将执行额外的行为来分离对象。通过将这种抓握预测机制与现有的视觉感知和基于变压器的knolling模型相集成，展示了一种能够整理和组织更复杂和人口密集的桌子设置的先进系统。

Immersive 3D Simulator for Drone-as-a-Service
Authors Jiamin Lin, Balsam Alkouz, Athman Bouguettaya, Amani Abusafia
我们提出了一个专为无人机即服务框架量身定制的 3D 模拟器。该模拟器能够采用动态算法来解决现实的交付场景。我们介绍了模拟器的架构设计及其对无人机送货能耗模型的使用。我们在模拟器中引入两种主要的操作模式：编辑模式和运行时模式。除了模拟功能之外，我们的模拟器还可以作为宝贵的数据收集资源，通过模拟场景促进数据集的创建。我们的模拟器通过提供直观的平台来可视化交付环境并与交付环境交互，从而为研究人员提供支持。此外，它可以在安全的模拟环境中进行严格的算法测试，从而消除了现实世界中无人机部署的需要。

Haptic-Enhanced Virtual Reality Simulator for Robot-Assisted Femur Fracture Surgery
Authors Fayez H. Alruwaili, David W. Halim Banoub, Jessica Rodgers, Adam Dalkilic, Christopher Haydel, Javad Parvizi, Iulian I. Iordachita, Mohammad H. Abedin Nasab
在本文中，我们为Robossis机器人辅助股骨骨折手术开发了虚拟现实VR模拟器。由于此类手术的学习曲线陡峭，VR 模拟器对于培训外科医生和工作人员至关重要。 Robossis 手术模拟器 RSS 旨在使用 Robossis 系统让用户沉浸在真实的手术环境中，就像在之前的现实世界尸体手术中完成的那样。 RSS 旨在将 Sigma 7 触觉控制器与 Robossis 手术机器人 RSR 和 Meta Quest VR 耳机连接起来。结果表明，RSR 在 6 个自由度中遵循用户命令，并防止骨段重叠。

Robotic Barrier Construction through Weaved, Inflatable Tubes
Authors H. J. Kim, H. Abdel Raziq, X. Liu, A. Y. Siskovic, S. Patil, K. H. Petersen, H. L. Kao
在本文中，我们提出了一种机制和相关的路径规划算法，用于利用围绕现有环境特征编织的挤压充气管来构造轻型屏障。我们的挤压管基于外翻的藤蔓机器人，在这种情况下，我们提出了一种引导其生长的新方法。我们根据精度弹性以及管子作为屏障的承受分布式负载的能力来描述该机制。我们进一步探索了一种算法，在给定特征图以及外部负载的大小和方向的情况下，可以确定在何处以及如何挤出障碍物。最后，我们展示了这种方法在围绕三个管道编织的自主挤压两层壁中的潜力。虽然是初步的，但我们的工作表明这种方法具有在杂乱环境中构建屏障的潜力，例如在避风或避雪。

Design and Experimental Evaluation of a Haptic Robot-Assisted System for Femur Fracture Surgery
Authors Fayez H. Alruwaili, Michael P. Clancy, Marzieh S. Saeedi Hosseiny, Jacob A. Logar, Charalampos Papachristou, Christopher Haydel, Javad Parvizi, Iulian I. Iordachita, Mohammad H. Abedin Nasab
面对股骨骨折手术过程中遇到的挑战，例如手术人员的高对准不良率和 X 射线暴露，机器人辅助手术已成为传统最先进手术方法的替代方案。本文介绍了用于机器人辅助股骨骨折手术的触觉系统Robossis的开发。 Robossis 包括一个 7 DOF 触觉控制器和一个 6 DOF 手术机器人。开发了单边控制架构来解决触觉控制器和 Robossis 手术机器人之间的运动学失配和运动传递问题。实时运动控制管道旨在解决运动传递问题，并通过实验测试进行评估。分析表明，Robossis 手术机器人可以遵循触觉控制器的预期轨迹，平均平移误差为 0.32 毫米，旋转误差为 0.07 度。此外，还开发了触觉渲染管道，通过将触觉控制器用户手部运动限制在 Robossis 手术机器人允许的关节限制内来解决运动学不匹配问题。最后，在尸体实验室测试中，Robossis 系统在模拟股骨骨折手术中协助外科医生。

Extending the Cooperative Dual-Task Space in Conformal Geometric Algebra
Authors Tobias L w, Sylvain Calinon
在这项工作中，我们提出了共形几何代数中协作双任务空间 CDTS 的扩展。 CDTS 最初是使用对偶四元数代数定义的，是一个完善的框架，用于使用两个操纵器简化任务定义。通过整合共形几何代数，我们的目标是进一步增强几何表现力，从而简化各种任务的建模。我们首先介绍 CDTS，然后介绍其基于合作点对的扩展，从而展示该公式。此扩展保留了基于对偶四元数的原始公式的所有优点，但添加了更多用于双臂任务的几何建模的工具。我们还介绍了如何将 CGA CDTS 与先前工作中导出的几何代数中的最优控制框架无缝集成。在实验中，我们演示了如何使用 CGA CDTS 对不同的目标和约束进行建模。

gafro: Geometric Algebra for Robotics
Authors Tobias L w, Philip Abbet, Sylvain Calinon
几何是机器人技术的基本组成部分，多年来出现了各种表示框架。最近，几何代数因其将许多先前的想法统一为一个代数的特性而受到关注。虽然已经有有效的几何代数开源实现可用，但它们都不是针对机器人应用的。我们希望通过我们的库 gafro 来解决这个缺点。本文概述了 gafro 的实现细节以及教程，gafro 是一个针对使用几何代数的机器人应用程序的高效 C 库。该库专注于使用共形几何代数。因此，各种几何基元可用于计算以及刚体变换。机器人系统的建模也是该库的一个重要方面。它实现了用于计算此类系统的运动学和动力学以及优化问题的目标的各种算法。

A multi-modal table tennis robot system
Authors Andreas Ziegler, Thomas Gossard, Karl Vetter, Jonas Tebbe, Andreas Zell
近年来，机器人乒乓球已成为感知和机器人控制的热门研究挑战。在这里，我们提出了一种改进的乒乓球机器人系统，具有高精度视觉检测和快速机器人反应。基于之前的工作，我们的系统包含一个 6 DOF 的 KUKA 机器人手臂，带有四个基于帧的摄像机和两个附加的基于事件的摄像机。我们开发了一种新颖的校准方法来校准这种多模态感知系统。对于乒乓球运动来说，旋转估计至关重要。因此，我们引入了一种新颖且更准确的自旋估计方法。

Spacecraft Autonomous Decision-Planning for Collision Avoidance: a Reinforcement Learning Approach
Authors Nicolas Bourriez, Adrien Loizeau, Adam F. Abdin
地球周围的空间环境正变得越来越多地充满活跃的航天器和空间碎片。为了避免潜在的碰撞事件，空间态势感知 SSA 活动和防撞 CA 技术的显着改进使得航天器的跟踪和操纵更加准确和可靠。然而，这些程序仍然在很大程度上涉及高水平的人为干预来做出必要的决定。对于日益复杂的太空环境，这种决策策略不太可能可持续。因此，成功地为关键的空间交通管理 STM 流程引入更高水平的自动化非常重要，以确保导航大量航天器所需的可靠性水平。这些过程的范围从碰撞风险检测到识别要采取的适当行动以及执行避让操作。这项工作提出了一种基于强化学习 RL 技术的航天器自主 CA 决策能力的实现。开发了一种基于部分可观察马尔可夫决策过程 POMDP 框架的新颖方法，用于训练航天器上的人工智能系统，同时考虑认知和偶然的不确定性。所提出的框架考虑了有关轨道碎片状态的不完善的监测信息，并允许人工智能系统有效地学习随机策略以执行准确的防撞机动 CAM。目标是成功地将自主实施 CAM 的决策过程委托给航天器，无需人工干预。

An Ontological Model of User Preferences
Authors Mona Abdel Keream, Daniel Be ler, Ayden Janssen, Sascha Jongebloed, Robin Nolte, Mihai Pomarlan, Robert Porzel
偏好的概念在许多学科中发挥着重要作用，包括涉及机器人与人类交互场景的服务机器人学。考虑到人类的偏好，机器人可以青睐这些交互。这就提出了如何表示偏好以支持这种偏好意识决策的问题。存在对偏好概念的几种正式解释。然而，这些方法不足以定义机器人在给定情况下所具有的选项的性质和结构。

World Model Based Sim2Real Transfer for Visual Navigation
Authors Chen Liu, Kiran Lekkala, Laurent Itti
Sim2Real 传输之所以受到欢迎，是因为它有助于从廉价的模拟器传输到现实世界。本文提出了一种新颖的系统，它将传统 textit 世界模型中的组件融合到一个强大的系统中，完全在模拟器中进行训练，将 textit Zero Shot 转移到现实世界。为了促进传输，我们使用基于文本鸟瞰 BEV 图像的中间表示。因此，我们的机器人学习在模拟器中导航，首先学习将基于第一人称视角 FPV 的 RGB 图像的复杂文本转换为 BEV 表示，然后学习使用这些表示进行导航。随后，在现实世界中进行测试时，机器人使用感知模型将基于 FPV 的 RGB 图像转换为下游策略使用的嵌入。使用 textit Anchor images 和 textit Mixture Density LSTM 结合状态检查模块不仅可以插入不确定和缺失的观测值，还可以增强模型在暴露于现实世界环境时的鲁棒性。我们使用 CARLA 模拟器中的 textit 差动驱动机器人收集的数据来训练模型。我们的方法的有效性通过将经过训练的模型部署到真实世界的差动驱动机器人上来证明。

"Do it my way!": Impact of Customizations on Trust perceptions in Human-Robot Collaboration
Authors Parv Kapoor, Simon Chu, Angela Chen
信任已被证明是有效的人类机器人协作的关键因素。在辅助机器人技术的背景下，信任因素对人类体验的影响更加明显。辅助机器人的个性化是与机器人采用和用户感知正相关的正交因素。在这项工作中，我们通过受试者内研究 N 17 调查这些因素之间的关系。我们在基线自主机器人行为的基础上提供不同级别的定制可能性，并研究其对信任的影响。我们的研究结果表明，定制化水平的提高与更高的信任度和舒适感相关。

Enabling Mixed Autonomy Traffic Control
Authors Matthew Nice, Matt Bunting, Alex Richardson, Gergely Zachar, Jonathan W. Lee, Alexandre Bayen, Maria Laura Delle Monache, Benjamin Seibold, Benedetto Piccoli, Jonathan Sprinkle, Dan Work
我们展示了自动驾驶车辆混合自主交通控制的新功能。凭借这一新功能，自动驾驶汽车可以塑造由其他非自动驾驶汽车组成的交通流，这有望在社会范围内提高交通系统的安全性、效率和能源成果。鉴于其他驾驶员的复杂动态及其对自动车辆团队的响应无法有效建模，因此研究混合自主移动交通控制必须在现场进行。由于没有现有的可扩展且负担得起的实验控制平台，因此该功能已被阻止。本文介绍了一个可扩展的开源硬件和软件平台，使一个由 100 辆车辆组成的团队能够作为一个协作车队执行多种不同的车辆控制算法，该车队由三种不同的品牌和型号组成，在总共 1022 小时内行驶了 22752 英里，超过 5

Robot Control based on Motor Primitives -- A Comparison of Two Approaches
Authors Moses C. Nah, Johannes Lachner, Neville Hogan
电机原语是控制器的基本构建块，它能够以最少的高级干预实现动态机器人行为。通过将运动原语视为基本模块，可以对不同的模块进行排序或叠加，以生成丰富的运动行为。在机器人技术中，提出了两种不同的方法：动态运动原语 DMP 和基本动态动作 EDA。虽然这两种方法都体现了类似的想法，但也存在显着差异。本文试图通过描述 DMP 和 EDA 之间的异同来澄清区别并提供统一的观点。我们提供八个机器人控制示例，包括排序或叠加运动、管理运动冗余和奇异性、避障以及管理物理交互。我们表明这两种方法在实施上存在明显差异。我们还讨论了如何将 DMP 和 EDA 结合起来，以充分利用这两种方法。

KernelGPA: A Globally Optimal Solution to Deformable SLAM in Closed-form
Authors Fang Bai, Kanzhi Wu, Adrien Bartoli
我们研究广义 Procrustes 分析 GPA，作为同时定位和建图 SLAM 问题的最小公式。我们提出了 KernelGPA，一种新颖的全局配准技术，用于解决可变形环境中的 SLAM。我们提出了可变形变换的概念，它对纠缠姿态和变形进行编码。我们使用核方法定义可变形变换，并表明可变形变换和环境贴图都可以以封闭形式全局求解，直至全局尺度模糊。我们通过最大化刚性的优化公式来解决尺度模糊性。我们使用高斯核演示了 KernelGPA，并用各种数据集验证了 KernelGPA 的优越性。

Enhancing Grasping Performance of Novel Objects through an Improved Fine-Tuning Process
Authors Xiao Hu, Xiangsheng Chen
抓取算法已经从平面深度抓取发展到利用点云信息，可以应用于更广泛的场景。然而，基于在基本开源数据集上训练的模型的数据驱动的掌握可能在新对象上表现不佳，而新对象通常需要在不同的场景中使用，因此需要使用新对象进行微调。驱动这些算法的数据本质上对应于6D姿势中手部的闭合区域，并且由于6D姿势的独特性，通常采用合成注释或真机注释方法。通过真实的机器注释获取大量数据具有挑战性，这使得合成注释成为一种常见的做法。然而，使用传统方法获取带注释的 6D 位姿数据非常耗时。因此，我们提出了一种快速获取新物体数据的方法，从而实现更有效的微调。我们的方法主要对抓取方向进行采样以生成和注释抓取。实验结果表明，我们对新对象的微调过程比其他方法快 400 倍。此外，我们提出了一种优化的抓取注释框架，该框架考虑了夹具关闭的影响，使注释更加合理。

VFAS-Grasp: Closed Loop Grasping with Visual Feedback and Adaptive Sampling
Authors Pedro Piacenza, Jiacheng Yuan, Jinwook Huh, Volkan Isler
我们考虑闭环机器人抓取的问题，并提出一种新颖的规划器，它使用视觉反馈和不确定性感知自适应采样策略 VFAS 来闭环。在每次迭代中，我们的方法 VFAS Grasp 通过生成种子抓取的随机扰动来构建一组候选抓取。然后使用一种新颖的指标对候选者进行评分，该指标结合了学习的掌握质量估计器、估计的不确定性以及与种子提案的距离，以促进时间一致性。此外，我们提出了两种机制来提高采样策略的效率。我们根据过去的掌握分数动态缩放采样区域的大小和其中的样本数量。我们还利用运动矢量场估计器来移动采样区域的中心。我们证明了我们的算法可以以 20 Hz 的频率实时运行，并且能够通过细化初始抓取建议来提高静态场景的抓取性能。

Parallel-Jaw Gripper and Grasp Co-Optimization for Sets of Planar Objects
Authors Rebecca H. Jiang, Neel Doshi, Ravi Gondhalekar, Alberto Rodriguez
我们提出了一个框架，用于优化用于多个物体的平面平行夹爪夹具。虽然优化通用夹具和抓取的接触位置都得到了很好的研究，但协同优化抓取和执行它们的夹具几何形状却受到较少的关注。因此，我们的框架合成了经过优化的夹具，可以稳定地抓取多组多边形物体。给定固定数量的接触点及其对物体面和夹爪的分配，我们的框架可以优化沿这些面的接触位置、每次抓取的夹爪姿势以及夹爪形状。我们的主要见解是在固定到夹具钳口的框架中提出形状和接触约束，并通过增强拉格朗日公式利用我们的抓取稳定性和夹具形状模型中的约束线性。这些共同实现了易于处理的非线性程序实现。我们将我们的方法应用于几个例子。第一个说明性问题表明在可能的情况下发现了几何上简单的解决方案。另一方面，空间受到限制，迫使多个物体通过彼此相同的特征进行接触。最后，工具集抓取示例表明我们的框架适用于复杂的现实世界对象。

PolyMerge: A Novel Technique aimed at Dynamic HD Map Updates Leveraging Polylines
Authors Mohamed Sayed, Stepan Perminov, Dzmitry Tsetserukou
目前，高清地图是自动驾驶汽车稳定运行的前提。此类地图包含车辆在导航期间要考虑的所有静态道路对象的信息，例如道路边缘、道路车道、人行横道等。为了生成此类高清地图，当前的方法需要处理从车载传感器获得的预先记录的环境数据。然而，记录这样的数据集通常需要大量的时间和精力。

RayDF: Neural Ray-surface Distance Fields with Multi-view Consistency
Authors Zhuoman Liu, Bo Yang
在本文中，我们研究连续 3D 形状表示的问题。大多数现有的成功方法都是基于坐标的隐式神经表示。然而，它们在渲染新视图或恢复显式表面点方面效率低下。一些工作开始将 3D 形状制定为基于射线的神经函数，但由于缺乏多视图几何一致性，学习到的结构较差。为了应对这些挑战，我们提出了一个名为 RayDF 的新框架。它由三个主要组件组成：1 简单的光线表面距离场；2 新颖的双光线可见性分类器；3 多视图一致性优化模块，用于驱动学习的光线表面距离达到多视图几何一致。我们在三个公共数据集上广泛评估了我们的方法，在合成和具有挑战性的现实世界 3D 场景上展示了 3D 表面点重建的卓越性能，明显超越了现有的基于坐标和基于射线的基线。最值得注意的是，我们的方法渲染 800x800 深度图像的速度比基于坐标的方法快 1000 倍，显示了我们的方法在 3D 形状表示方面的优越性。

Refining Diffusion Planner for Reliable Behavior Synthesis by Automatic Detection of Infeasible Plans
Authors Kyowoon Lee, Seongun Kim, Jaesik Choi
通过训练轨迹扩散模型并使用辅助引导函数调节采样轨迹，基于扩散的规划在长视野、稀疏奖励任务中显示出了有希望的结果。然而，由于其生成模型的性质，扩散模型不能保证生成可行的计划，从而导致执行失败并妨碍规划器在安全关键应用中发挥作用。在这项工作中，我们提出了一种新方法，通过为容易出错的计划提供细化指导来细化由扩散模型生成的不可靠计划。为此，我们提出了一种名为恢复间隙的新指标，用于评估扩散模型生成的个体计划的质量。恢复间隙由间隙预测器估计，间隙预测器产生恢复间隙指导以细化扩散规划器。我们还提出了一个归因图正则化器，以防止次优差距预测器生成的对抗性细化指导，从而能够进一步细化不可行的计划。我们在需要长期规划的离线控制设置中的三个不同基准上证明了我们的方法的有效性。

Variational Curriculum Reinforcement Learning for Unsupervised Discovery of Skills
Authors Seongun Kim, Kyowoon Lee, Jaesik Choi
基于互信息的强化学习 RL 已被提出作为一种有前途的框架，用于通过互信息 MI 最大化或变分赋权来自主检索复杂技能，而无需面向任务的奖励函数。然而，学习复杂的技能仍然具有挑战性，因为训练技能的顺序很大程度上影响样本效率。受此启发，我们将变分赋权重新定义为具有内在奖励函数的目标条件强化学习中的课程学习，我们将其命名为变分课程 RL VCRL 。从这个角度来看，我们提出了一种基于信息论的无监督技能发现的新方法，称为价值不确定性变分课程 VUVC。我们证明，在规律性条件下，与统一课程相比，VUVC 加速了访问状态的熵增加。我们在样本效率和状态覆盖速度方面验证了我们的方法在复杂导航和机器人操作任务上的有效性。

CARPE-ID: Continuously Adaptable Re-identification for Personalized Robot Assistance
Authors Federico Rollo, Andrea Zunino, Nikolaos Tsagarakis, Enrico Mingo Hoffman, Arash Ajoudani
在当今的人机交互 HRI 场景中，普遍存在的趋势是假设机器人应与最近的个体合作，或者场景仅涉及单个人类演员。然而，在现实场景中，例如车间操作，这种假设可能不成立，并且需要机器人在拥挤的环境中进行个性化目标识别。为了满足这一要求，在这项工作中，我们提出了一种基于持续视觉适应技术的人员重新识别模块，以确保机器人与适当的个人无缝合作，即使受到不同的视觉外观或部分或完全遮挡的影响。我们在实验室环境和 HRI 场景（即一个人通过移动机器人执行任务）中单独使用录制的视频来测试该框架。要求目标在跟踪过程中改变其外观并从摄像机视野中消失，以测试遮挡和服装变化的挑战性情况。我们将我们的框架与最先进的多目标跟踪 MOT 方法之一进行比较，结果表明 CARPE ID 可以在除两种极限情况外的所有情况下在整个实验中准确跟踪每个选定的目标。

Radar-Lidar Fusion for Object Detection by Designing Effective Convolution Networks
Authors Farzeen Munir, Shoaib Azam, Tomasz Kucner, Ville Kyrki, Moongu Jeon
物体检测是感知系统的核心组成部分，为自我车辆提供周围环境的信息，以确保安全的路线规划。虽然摄像头和激光雷达拥有非常先进的感知系统，但它们的性能在恶劣的天气条件下可能会受到限制。相比之下，毫米波技术使雷达能够在这种条件下有效运行。然而，由于数据的稀疏性，仅仅依靠雷达构建感知系统并不能完全捕获环境。为了解决这个问题，引入了传感器融合策略。我们提出了一个双分支框架来集成雷达和激光雷达数据以增强对象检测。主分支专注于提取雷达特征，而辅助分支则提取激光雷达特征。然后使用附加注意力将它们组合起来。随后，通过新颖的并行分叉结构 PFS 处理集成特征，以管理尺度变化。然后使用区域提议头进行对象检测。我们使用 COCO 指标评估了我们提出的方法在 Radiate 数据集上的有效性。结果表明，在有利和不利的天气条件下，它分别比最先进的方法高出 1.89 和 2.61。

RGB-X Object Detection via Scene-Specific Fusion Modules
Authors Sri Aditya Deevi, Connor Lee, Lu Gan, Sushruth Nagesh, Gaurav Pandey, Soon Jo Chung
多模态深度传感器融合有潜力使自动驾驶汽车能够在所有天气条件下直观地了解周围环境。然而，现有的深度传感器融合方法通常采用具有混合多模态特征的卷积架构，需要大型共配多模态数据集进行训练。在这项工作中，我们提出了一种高效且模块化的 RGB X 融合网络，该网络可以通过场景特定的融合模块利用和融合预训练的单模态模型，从而能够使用小型、共同配准的多模态数据集创建联合输入自适应网络架构。我们的实验证明了我们的方法与 RGB 热数据集和 RGB 门控数据集上的现有工作相比的优越性，仅使用少量附加参数进行融合。

Social Interaction-Aware Dynamical Models and Decision Making for Autonomous Vehicles
Authors Luca Crosato, Kai Tian, Hubert P. H Shum, Edmond S. L. Ho, Yafei Wang, Chongfeng We
交互感知自动驾驶 IAAD 是一个快速发展的研究领域，专注于开发能够与人类道路使用者安全高效交互的自动驾驶汽车。这是一项具有挑战性的任务，因为它要求自动驾驶车辆能够理解和预测人类道路使用者的行为。在这篇文献综述中，本文对 IAAD 研究的现状进行了调查。从术语检查开始，重点关注用于对驾驶员和行人行为进行建模的挑战和现有模型。接下来，对交互建模提出的各种技术进行了全面的回顾，包括认知方法、机器学习方法和博弈论方法。

A Stochastic Nonlinear Model Predictive Control with an Uncertainty Propagation Horizon for Autonomous Vehicle Motion Control
Authors Baha Zarrouki, Chenyang Wang, Johannes Betz
由于通过非线性系统传播不确定性的任务非常复杂，因此在实时应用中采用随机非线性模型预测控制 SNMPC 具有挑战性。在具有扩展预测范围的高维系统（例如自动驾驶汽车）中，这种困难变得更加明显。为了增强 SNMPC 的闭环性能和可行性，我们引入了不确定性传播范围 UPH 的概念。 UPH 限制了系统动力学中不确定性传播的时间，防止轨迹发散，优化反馈环路优势，并减少计算开销。我们的 SNMPC 方法利用多项式混沌展开 PCE 来传播不确定性，并结合状态期望的非线性硬约束和非线性概率约束。我们通过估计非线性约束期望和方差将概率约束转换为确定性约束。然后，我们展示了我们的算法在实时控制高维、高度非线性系统（自动驾驶乘用车的轨迹跟踪）方面的有效性，并使用动态非线性单轨道模型进行建模。实验结果表明，我们的方法具有强大的能力，能够以高达 37.5m s 的速度遵循最佳赛道轨迹，同时处理状态估计干扰，实现 97Hz 的最小求解频率。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页

pic from pexels.com