一、什么是 AI Agent?
1、用快思考与慢思考类比大模型的能力
根据丹尼尔·卡尼曼的著作《思考,快与慢》,人类的思维可以分为两大系统:系统1和系统2。系统1负责直觉式的快速思考,这种思考往往是无意识的;而系统2则擅长进行有意识的逻辑推理和主动控制。
在探讨大型模型的思维能力时,我们首先可以观察到,这些大模型可能具备了类似人类的分析问题能力,它们能够理解、分析和解决复杂问题。进一步地,人类与动物的一个重要区别在于人类擅长创造和使用工具。随着大模型认知能力的不断提升,当它们遇到自身不擅长的领域时,这些大模型可能会展现出一种类似于人脑使用工具的能力——即寻找并利用适当的工具来解决问题,而不是直接依靠自身能力去解决。
2、OpenAI 对 AIAgent 的定义
在2023年6月,Open AI 的应用研究主管 Lilian Weng发 表了《LLM Powered Autonomous Agents》一文,其中她提出了一个公式:“智能体=大模型(LLMs)+规划(Planning)+记忆(Memory)+工具使用(Tools)”。
1)智能体的推理与执行能力,指的是利用大模型(LLMs)来理解、执行并回顾任务。这包括将复杂任务分解为更小、更易管理的子任务以提高效率,并且通过吸取历史经验和错误教训来优化行动的质量。
2)智能体具备短期与长期记忆功能:短期记忆通过利用提示(Prompt)中的信息和上下文数据进行学习,而长期记忆则通过外部向量存储和快速检索技术来实现,这使得智能体能够在更广泛的时间跨度内存储和回忆(理论上无限)信息。
3)智能体具有调用外部 API 来使用“工具”的能力,这包括浏览网页、启动应用程序、读写文件、进行支付甚至操控用户设备等。与传统的自动化工具不同,AI智能体能够在未知和不可预测的新环境中有效工作。
4)在Open AI 的定义基础上,还应补充智能体的反馈接受能力。正如人类在处理复杂任务时需要与环境互动,我们的行为会改变环境,环境也会给予我们反馈,我们根据这些反馈进行决策。因此,智能体应该能够根据采取的行动接收正面或试错性的反馈、阶段性成果或奖励,并据此进行下一轮的规划和行动。
3、AI Agent 更广泛的定义
在 AI Agent 的整体架构设计中,一般可以将框架划分为五个主要模块:感知、定义、记忆、规划和行动。
二、AI Agent 的关键能力要素
1、记忆能力
目前的研究普遍将记忆分为短期记忆和长期记忆两大类。
2、规划能力
规划是 AI Agent 解决复杂问题的关键能力,主要包括子目标分解、反思和提炼等。
3、行动能力
智能体的行动能力主要体现在文本输出、工具使用和具身动作等方面。
4、减少幻觉
减少幻觉主要依赖于基础模型的进步和 Scaling Law,同时也有工程方法可以减少现有模型的幻觉。
三、AI Agent 发展的三个阶段
1、AI Agent 能力的三个发展阶段
1) Embedding 嵌入式模式:这一阶段主要依赖于人类问答,提供信息和建议,这是目前最普遍的大模型(LLM)应用方式。
2) Copilot 辅助驾驶模式:在这一阶段,Agent 基于人类设定的目标,完成单一或简单任务。
3) Agent 智能体模式:智能体在这一阶段能够基于人类的目标,执行多任务、复杂任务或任务组合。
2、ChatGPT 代表了第一阶段的大模型能力。
它并不完全符合 Agent 的典型定义,主要向用户提供广泛的世界知识。
3、目前,单一任务场景下已有一些AI 应用实例
在办公场景中,我们有 Microsoft 365 Copilot(及其新推出的个人版 Copilot Pro)、Google Duet AI、专注于轻文档办公的 Notion AI、辅助代码开发的 Copilot X 以及数据分析处理的 Deepnote AI 等。这些应用常见的功能包括起草文档、内容汇总、提供公式建议等,它们通常以侧边栏或对话框的形式出现,帮助用户自动调用工作空间中的文件和信息,并进行处理生成。
4、展望未来,AI Agent 将不仅仅局限于解决问题的执行层面,而是将进一步深入到如何解决问题的规划层面。
在工作场景中,我们对 AI Agent 的期待包括:
1) 连续执行:Agent 能够对用户的任务指令进行拆解,分解为多个步骤,对这些步骤进行规划排序并连续执行。
2) 完成复杂任务:目前 Agent 只能解决单个或少数简单任务,未来期望能够处理多个复杂任务。
3) 多步骤规划:Agent 在执行后续步骤的同时,能够保持对任务目标和前序任务的记忆,具备强大的步骤规划执行能力。
原文链接:
本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载者并注明出处:https://www.jmbhsh.com/yule/33169.html