
一架自主无人机在山区运水帮助扑灭山火时,可能会遭遇到突然的旋风,使其偏离航线。如何在飞行中快速适应这些未知的干扰,对无人机的飞行控制系统而言是一个巨大的挑战。
为了帮助这类无人机保持目标飞行,麻省理工学院的研究人员开发了一种基于机器学习的新型自适应控制算法,该算法可以在阵风等不可预测的因素下,最大限度地减少无人机偏离预定轨迹的偏差。
与传统方法不同,这项新技术不需要自主无人机的编程人员事先了解这些不确定干扰的类型。相反,控制系统的人工智能模型只需从15分钟的飞行时间中收集少量观测数据,即可学习所有必要的信息。技术可以自动确定应使用哪种优化算法来适应干扰,从而提高跟踪性能。它会选择最适合该无人机所面临特定干扰几何形状的算法。
研究人员使用一种名为元学习的技术训练他们的控制系统同时执行这两件事,该技术教会系统如何适应不同类型的干扰。
综合起来,这些因素使他们的自适应控制系统在模拟中实现了比基线方法减少50%的轨迹跟踪误差,并且在训练期间未见过的风速下表现更佳。
未来,这种自适应控制系统可以帮助自主无人机在强风条件下,更高效地运送重型包裹或监测森林的火灾多发区域。
“这些组件的并行学习是我们方法的优势所在。通过利用元学习,我们的控制器可以自动做出最适合快速适应的选择。”麻省理工学院机械工程系数据、系统与社会研究所的助理教授、信息与决策系统实验室首席研究员、该控制系统论文的资深作者Navid Azizan说道。
寻找合适的算法
通常,控制系统会包含一个对无人机及其环境进行建模的函数,并包含一些关于潜在扰动类型的现有信息。但在充满不确定性的现实世界中,通常不可能预先手动设计这种类型。
许多控制系统使用一种基于流行优化算法(称为梯度下降)的自适应方法来估计问题的未知部分,并确定如何在飞行过程中使无人机尽可能接近其目标轨迹。然而,梯度下降只是众多可供选择的算法中的一种,这些算法被称为镜像下降。
Azizan解释说:“镜像下降是一个通用算法家族,对于任何给定的问题,其中一种算法可能比其他算法更合适。关键在于如何选择最适合问题的特定算法。在我们的方法中,我们将这一选择自主化。”
在他们的控制系统中,研究人员用一个神经网络模型替换了包含潜在扰动类型的函数,该模型学习从数据中接近这些扰动。这样,他们就不需要预先知道这架无人机可能遇到的风速了。
他们的方法还使用一种算法,在从数据中学习神经网络模型的同时,自动选择正确的镜像下降函数,而不是假设用户已经选择了理想的函数。研究人员为该算法提供了一系列函数供其选择,并由其找到最适合当前问题的函数。
学习适应
虽然无人机每次飞行时遇到的风速可能会发生变化,但控制器的神经网络和镜像函数应该保持不变,这样就无须每次都重新计算。
为了提高控制器的灵活性,研究人员采用了元学习技术,通过在训练过程中展示一系列风速组来教会它适应。
新的方法可以应对不同的目标,因为使用元学习,可以从数据中高效地学习到不同场景下的共享表征。最终,用户向控制系统输入目标轨迹,它会实时地不断重新计算无人机应如何产生推力,使其尽可能接近该轨迹,同时适应遇到的不确定干扰。
在模拟和实际实验中,研究结果都表明,在测试的每个风速下,新的方法都比基线方法的轨迹跟踪误差显著减小。“即使风的干扰比我们在训练期间遇到的要强得多,我们的技术仍然能够成功应对。”Azizan补充道。
此外,随着风速的增大,他们的方法优于基线的幅度也在扩大,这表明它能够适应具有挑战性的环境。
该团队目前正在进行硬件实验,以在具有不同风况和其他干扰的真实无人机上测试他们的控制系统。他们还希望扩展他们的方法,使其能够同时处理来自多个来源的干扰。例如,风速的变化可能会导致无人机携带的包裹重量在飞行过程中发生变化,尤其是在无人机携带晃动的有效载荷时。
他们还希望探索持续学习,以便无人机能够适应新的干扰,而无须根据已有的数据进行重新训练。这项研究在无人机复杂环境下的自主性方面取得了突破性进展,将元学习与传统的自适应控制相结合,从数据中学习非线性特征。新方法的关键在于使用镜像下降技术,以现有技术无法做到的方式利用问题的底层几何结构。研究人员的工作可以为需要在复杂和不确定环境中运行的自主系统的设计做出重大贡献。