MIT中国博士生提出可验证型神经网络控制器框架,将为控制复杂非线性系统提供全新解决方案

近年来,神经网络控制技术在机器人领域表现出惊人的性能。这种基于深度学习的技术已经驱动各种先进机器人完成了一系列复杂的任务。

对于麻省理工学院的博士生杨来说,这些先进机器人的名字早已脱口而出。

图|杨玉杰(来源:杨玉杰)

例如:

有一款可以煮咖啡、主动与人交谈的Figure万能人形机器人;有可以系鞋带、晾衣服的ALOHA操作机器人;还有可以在各种地形上执行侦察任务的机器狗。

在所有这些智能机器人的背后,都运行着精心设计的神经网络控制器。

尽管神经网络控制显示出良好的实用性,但它仍然缺乏对安全关键应用的稳定性保证。

在控制理论领域,学者们通过规范优化和形式化方法为线性控制器或多项式控制器提供了严格的稳定性证明。

然而,要使更复杂的神经网络控制器具有相同的稳定性保证仍然存在一些问题。

对于基于神经网络的控制器,进行严格的李亚普诺夫稳定性验证具有重要意义。主要原因如下:

首先,我们必须确保系统的安全性和可靠性。

机器人、自动驾驶汽车和工业控制系统都涉及复杂的动态过程,一旦控制系统不稳定,就可能导致严重的安全事故。

通过李亚普诺夫稳定性验证,可以正式证明系统在一定区域内的渐近稳定性,从而保证系统的安全可靠运行。

二是拓展神经网络在重点领域的应用。

由于缺乏稳定性保证,当前神经网络控制器在关键安全领域的应用仍受到很大限制。

一旦其稳定性能够得到严格验证,神经网络就可以大规模应用于机器人、航空空航天、生命科学等领域,从而发挥强大的控制性能。

第三,弥补神经网络的理论缺陷。

尽管神经网络在实践中表现突出,但它缺乏坚实的理论基础。

结合李亚普诺夫稳定性理论,可以为神经网络控制器注入理论支持,弥补其在可解释性和可靠性方面的不足。

第四,促进控制理论和机器学习的融合。

神经网络和李亚普诺夫理论分别代表了机器学习和控制理论的最新进展。

神经网络控制器的李亚普诺夫验证是这两个领域结合的有力尝试,必将促进这两个领域的交叉融合并产生新的理论突破。

第五,应对复杂系统挑战。

随着控制对象的日益复杂,单一的经典控制方法很难完全满足需求。

对于神经网络控制器,它具有学习复杂映射的能力。如果其稳定性也能得到保证,将为控制复杂非线性系统提供一种新的解决方案。sx304不锈钢

基于此,杨及其团队提出了一种新的框架,该框架采用快速经验反证和正则化技术,旨在同时学习神经网络控制器和李亚普诺夫稳定性证明,使其能够应用于复杂的非线性动态系统。lsd文件怎么编辑

(来源:arXiv)

杨等人提出的新公式方法不仅定义了一个现有研究中从未涉及的更大的稳定区域,而且改进了稳定性导数的约束条件,使其仅关注可证明的稳定区域的范围。

通过这种新颖的方法,研究组突破了现有神经网络控制器在提供稳定性证明方面的瓶颈,为更复杂的神经网络控制系统提供了更大的可验证稳定区域。

对于李亚普诺夫稳定性条件的验证,团队采用严格的事后验证,使用基于线性边界传播的可扩展神经网络验证技术,并使用分支定界算法和最先进的α,β-冠神经网络验证器,使验证方法既高效又灵活。

整个训练过程和验证过程可以在GPU(图形处理单元)上加速,而无需依赖昂贵的传统求解器。

通过这种新的验证方法,可以避免昂贵的传统求解器,并确保李亚普诺夫稳定性条件的严格验证。

同时可以兼顾计算效率和灵活性,使得神经网络控制器的稳定性验证更加高效可行。

通过此,研究组为复杂非线性系统的稳定控制提供了一种新的解决方案,在工业、交通运输、航空空航天等领域具有潜在的应用前景。

首先,它可以用于机器人控制系统。

也就是说,该方法可用于机器人运动控制。特别是对于具有复杂非线性动力学的机器人系统,采用所提出的神经网络控制器和李亚普诺夫证明可以保证机器人运动的稳定性和收敛性。

其次,它可以用于自动驾驶和无人机控制。

自动驾驶汽车和无人机等系统通常具有非线性和高维动力学方程。

通过该方法,可以设计出具有稳定性保证的神经网络控制器,以提高自动驾驶和无人机的安全性和可靠性。

第三,它可以用来控制航天器和飞机空。

航天器和航天器空通常具有复杂的非线性动力学模型,该方法可以为它们提供神经网络控制解决方案以确保稳定性。

第四,可用于工业过程控制。

许多工业过程,如化工和冶金,都涉及复杂的非线性动态系统。该方法可用于设计具有稳定性保证的神经网络控制器,优化生产过程的控制性能。

第五,它可以用于生物医学系统的建模和控制。

对于某些生物医学系统,如基因调控网络,可以用非线性动力学模型来描述。因此,该方法有望用于这些系统的建模和控制。

(来源:arXiv)松下X600投影机是长焦还是短焦

另据报道,该团队在相关论文截止日期前两周重新检查了论文中的数学公式。

在这次讨论中,他们不仅对公式进行了深度优化,还发现了该领域现有研究中的错误和遗漏。

虽然这项研究的初步实验结果已经远远超过了该领域最先进的成果。然而,上述发现也让他们决定采取一个大胆的举措:推翻现有的所有实验数据,基于优化后的配方全面设计实验。

“这是一个具有挑战性的决定,因为重新进行实验意味着巨大的风险和额外的工作量,但我们坚持确保研究结果的严谨性和准确性。”杨玉杰说。

经过不断奋斗,他们终于在截止日期前4个小时完成了所有实验和论文的最终修改,确保了这一成果的高质量和创新性。

最后,相关论文基于状态和输出反馈的李亚普诺夫稳定神经控制:一种高效综合和验证的新公式。Sis和验证)在国际机器学习会议(ICML)上发表【1】。

杨和丰田研究所的戴鸿凯博士是合作者。

图|相关论文(来源:arXiv)

下一步,课题组将从以下几个方面进行探索。

一是提高模型的通用性和适应性。

即开发一种基于神经网络的方法来估计或优化系统的可靠性,并对价值函数和控制障碍函数等其他控制指标进行调试和优化,以提高处理复杂动态系统时的可扩展性和灵活性。

其次,理论与实践应进一步结合。

目前,研究小组在无人机和一些标准控制基准方面取得了进展。

未来,该框架可用于越来越复杂的控制系统,如工业机器人和自动驾驶汽车,以验证和提高其在复杂实际场景中的稳定性和可靠性。

第三,将开展跨学科合作。

鉴于研究问题的复杂性和跨学科性质,他们计划与机器学习领域的专家合作,努力开发更好的解决方案。

如上所述,为了合成针对一般非线性动态系统的具有李亚普诺夫稳定性的神经网络控制器,研究组还使用了神经网络验证领域的最新验证工具α,β-crown(https://abcrown.org)。

α,β-冠由杨的两位合作者,伊利诺伊大学的张欢教授和加州大学的施博士共同开发。

α,β-CROWN在大规模计算机视觉神经网络的鲁棒性验证和神经网络控制器的安全性验证中表现出了优异的扩展性。

它使用验证问题的网络结构,通过在神经网络中传播线性边界来加速操作。

同时,α,β-CROWN的边界传播过程具有良好的“GPU友好性”,支持大规模网络的高效验证,并可借助分支定界技术快速评估多个子问题。

因此,杨还希望进一步利用α,β-冠的能力来解决更多神经网络控制系统的验证问题。

参考资料:

1 . https://arxiv . org/pdf/2404.07956

排版:道克斯

01/科学家开发新型微针电极阵列并提出一种新的MEMS兼容混合制造方案,可用于脑机接口和电化学传感。

02/科学家设计活性渗透纳米载体,完美平衡药物释放和胞转作用,有助于开发纳米抗肿瘤药物。

03/科学家制备一种新型液晶弹性体,无需传统照明器即可实现内部发光,大大降低了功能集成材料的制造成本。

04/合成钻石也可以在温和的条件下生产。科学家发现了一种新的液态合金体系,并成功制备了多晶金刚石薄膜。

05/科学家创建了一个文生视频的大型模型,其中包含四个高效变体以更好地处理时间空维度,并将变形金刚与扩散模型完美结合。

未经允许不得转载:科技让生活更美好 » MIT中国博士生提出可验证型神经网络控制器框架,将为控制复杂非线性系统提供全新解决方案