简单与适应性:科学家提出了一种整合习惯行为和目标导向行为的人工智能方法

2025-01-11 07:47来源:本站

  

  Simplicity versus adaptability: Understanding the balance between habitual and goal-directed behaviors

  生物和人工智能驱动的机器都需要迅速采取行动,适应各种情况。在心理学和神经科学中,行为可以分为两种类型——习惯性(快速、简单但不灵活)和目标导向(灵活但复杂、缓慢)。

  诺贝尔经济学奖得主丹尼尔·卡尼曼(Daniel Kahneman)将其区分为系统1和系统2。然而,关于它们是独立和相互冲突的实体还是相互支持的组成部分,正在进行辩论。

  来自冲绳科学技术研究所(OIST)和上海微软亚洲研究院的科学家们提出了一种新的人工智能方法,在这种方法中,习惯和目标导向行为系统可以学习相互帮助。

  该方法通过计算机模拟迷宫的探索过程,快速适应不断变化的环境,并重现了人类和动物在长时间适应某种环境后的行为。

  这项发表在《自然通讯》(Nature Communications)杂志上的研究,不仅为开发在新兴的人工智能领域快速可靠地适应的系统铺平了道路,还为我们如何在神经科学和心理学领域做出决策提供了线索。

  科学家们以最近备受关注的“主动推理”理论为基础,在进行奖惩强化学习(强化学习)的人工智能智能体中,建立了将习惯系统和目标导向系统整合在一起的学习行为模型。

  在论文中,他们创建了一个模拟任务的计算机模拟,在这个任务中,老鼠根据视觉线索探索迷宫,当它们到达目标时获得食物奖励。

  他们研究了这两个系统在与环境互动时是如何适应和整合的,结果表明它们可以快速实现适应性行为。观察到AI agent通过强化学习收集数据并改进自身行为。

  在漫长的一天工作之后,我们通常会自动驾驶回家(习惯性行为)。然而,如果你刚刚搬家,没有注意,你可能会发现自己习惯性地开车回到老地方。

  当你发现自己在这样做的时候,你会改变方向(目标导向的行为),重新驶向你的新家。传统上,这两种行为被认为是独立工作的,导致行为要么是习惯性的、快速的但不灵活的,要么是目标导向的、灵活的但缓慢的。

  “在学习过程中,从目标导向行为到习惯行为的自动转变是心理学上一个非常著名的发现。我们的模型和模拟可以解释为什么会发生这种情况:大脑更喜欢确定性更高的行为。随着学习的进展,习惯性行为变得不那么随机,从而增加了确定性。因此,经过大量训练后,大脑更倾向于依赖习惯行为,”OIST认知神经机器人研究部门的前博士生、该论文的第一作者韩冬奇博士解释说。

  对于人工智能尚未训练过的新目标,它使用环境的内部模型来计划其行动。它不需要考虑所有可能的行动,而是使用习惯性行为的组合,这使得计划更有效。

  这对传统的人工智能方法提出了挑战,传统的人工智能方法要求所有可能的目标都明确地包括在训练中,以便实现这些目标。在这个模型中,每个期望的目标都可以通过灵活地结合所学知识而不需要明确的训练来实现。

  认知神经机器人研究部门负责人Jun Tani教授说:“在灵活行为和习惯性行为之间取得一种平衡或权衡是很重要的。”“实现目标可能有很多可能的方法,但考虑所有可能的行动是非常昂贵的,因此以目标为导向的行为受到习惯行为的限制,以缩小选择范围。”

  韩博士开始研究人工智能算法时,对神经科学和人工智能与人类智能之间的差距产生了兴趣。“我开始思考人工智能如何能像人类一样更有效、更适应环境。我想了解潜在的数学原理,以及我们如何利用它们来改进人工智能。这就是我做博士研究的动机。”

  理解习惯行为和目标导向行为之间的差异具有重要意义,特别是在神经科学领域,因为它可以揭示神经系统疾病,如多动症、强迫症和帕金森病。

  “我们正在探索大脑中多个系统协同工作的计算原理。我们还发现,多巴胺和血清素等神经调节剂在这一过程中起着至关重要的作用,”神经计算部门负责人Kenji Doya教授解释说。

  “人工智能系统从大脑中获得灵感,并被证明能够解决实际问题,可以作为理解人类和动物大脑中发生的事情的宝贵工具。”

  韩博士希望帮助建立更好的人工智能,可以调整他们的行为来实现复杂的目标。

  “我们对开发在执行日常任务时具有接近人类能力的人工智能非常感兴趣,所以我们希望解决人类与人工智能之间的差距。我们的大脑有两种学习机制,我们需要更好地了解它们是如何协同工作以实现我们的目标的。”

  更多信息:韩冬琪等,用变分贝叶斯协同习惯和目标,Nature Communications(2024)。DOI: 10.1038/s41467-024-48577-7期刊信息:自然通讯由冲绳科学技术研究所提供引文:简单性与适应性:科学家提出了集成习惯和目标导向行为的人工智能方法(2024,6月14日)检索自https://techxplore.com/news/2024-06-simplicity-scientists-ai-method-habitual.html。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。

宝贝巴声明:未经许可,不得转载。