1.9 控制架构
要用目前提出的基于动态系统的控制律控制机器人,需要一种控制结构。动态系统可以在轨迹规划时使用,也可以直接发送到关节来控制扭矩。在轨迹规划过程中使用时,控制架构依赖于初级控制器跟踪动态系统规定的动力学参数(即速度、加速度),并生成所需的扭矩。这通常由制造商内置的位置或速度控制器来完成。动态系统还经常在笛卡儿空间中生成轨迹。要按此轨迹运行,需要使用逆向运动学和逆动力学处理器。
本书中使用的控制架构可分为两大类:开环和闭环关节运动架构。如图1.17和图1.18所示。请注意,开环并不意味着机器人的整个控制系统以开环方式运行。机器人的行为始终随其环境的变化而做出反应。事实上,在本书使用的开环架构中,机器人仍然通过外部传感器跟踪环境的状态。例如,机器人会实时接收来自摄像机和激光雷达的信息,以追踪障碍物和目标的位置。如果其中一个移动,动态系统将生成新的轨迹以避开障碍物并实时适应目标的新位置。
图1.17 本书采用的典型开环关节运动发生器架构。在关节空间中进行控制时,不需要逆向运动学模块(图a)。当动态系统控制末端执行器路径时,需要单独的逆向运动学处理模块(图b)。当检测到目标的当前位置后,动态系统生成机器人所需的运动。对动态系统产生的预期速度的跟踪由低电平控制器来实现。动态系统仅在跟踪外部目标时(包括避开障碍物)闭合回路,而不会在当前关节所在位置处关闭
请注意,除非另有明确定义,否则在所有这些机器人实验中(以及在本书中),参考坐标系的原点都附着在目标上。因此,运动是相对该参考系进行控制的。如前所述,这种表示方法使动态系统的参数对目标位置的变化保持不变。此外,除非另有说明,否则用笛卡儿坐标系来表示机器人的运动。
在开环关节架构中,运动发生器的状态不会根据传感器信息更新,而是根据机器人先前的预期状态更新(见图1.17)。这些架构有两个优点,但也有缺点。主要优点是,在机器人内部进行通信,从中央处理器到电机板和背板的延迟具有稳定性。尽管延迟看起来可能是无限小的,但它们不是恒定不变的。因此,如果机器人移动极为迅速(例如在飞行中捕捉物体),它们的影响可能非常显著。将关节控制与主轨迹控制分离的另一个优点是,可以单独研究动态系统运动发生器的性能和稳定性,并且不依赖机器人的特定动力学和运动学系统。然而,由于运动发生器不能随机器人的状态实时更新,因此无法补偿内部干扰(例如,关节因自锁而不移动,或因齿隙过大而移动不精确)。此外,除非机器人配备触觉传感器或外力扭矩传感器以在接触时闭合回路,或者内置阻抗控制律,否则它可能无法对接触做出反应。因此,在没有额外传感器的情况下,由这些结构驱动的机器人可能会表现得和低级控制器一样僵硬。这些架构最适合用于要求机器人具有极高速度和反应力,并且操作空间完全安全且可观察的场景。
相反,闭环关节运动发生器根据机器人当前状态的测量值在每个时间节点更新控制律(见图1.18)。因此,任何干扰都会被传输到运动发生器中,并通过学习的动态系统进行动态补偿。本书展示了如何在运行时将这种方法用于训练机器人。系统的这种即时自然反应允许用户随时以安全的方式中断机器人的运动。然后,用户可以使用该中断向机器人显示一条不同的路径。当与增量式学习更新法相结合时,该机制可用于动态塑造机器人的刚度/柔性。闭环关节运动发生器的一个缺点是,该架构容易因信道中的延迟而产生不稳定。所以,必须研究运动发生器的稳定性,同时考虑低电平控制器。图1.18c说明了一种控制架构,其中运动发生器和低电平控制器集成在一个块中,以解决上述问题。
图1.18 闭环关节运动发生器架构,包括关节控制(图a)、笛卡儿路径控制(图b)和直接扭矩控制(图c)。机器人的预期运动是根据机器人当前的状态产生的。红色线显示的信道延迟可能造成不稳定或性能恶化。因此,在研究动态系统运动发生器的稳定性时,必须考虑整个控制回路的稳定性
本书中使用了各种形式的闭环控制架构,架构的选取取决于用于实现控制的机器人类型。一些机器人(如Katana)不允许在机器人移动时进行关节运动。因此,此类机器人仅适用于开环关节运动模型。其他机器人的闭环控制各不相同,例如巴雷特(Barrett)臂、轮椅(只能控制在某些位置上)或库卡机械臂(可以控制扭矩)。表1.1总结了本书中介绍的所有控制架构。
表1.1 每章讨论的控制架构概述
注:位置控制器是由制造商提供的内置控制器。因此,控制器参数要么是未公布的,要么是部分公布的。
[1]见https://www.epfl.ch/labs/lasa/mit-press-book-learning/。