Agent AI AI应用落地关键技术

一、什么是 AI Agent？

1、用快思考与慢思考类比大模型的能力

根据丹尼尔·卡尼曼的著作《思考，快与慢》，人类的思维可以分为两大系统：系统1和系统2。系统1负责直觉式的快速思考，这种思考往往是无意识的；而系统2则擅长进行有意识的逻辑推理和主动控制。

在探讨大型模型的思维能力时，我们首先可以观察到，这些大模型可能具备了类似人类的分析问题能力，它们能够理解、分析和解决复杂问题。进一步地，人类与动物的一个重要区别在于人类擅长创造和使用工具。随着大模型认知能力的不断提升，当它们遇到自身不擅长的领域时，这些大模型可能会展现出一种类似于人脑使用工具的能力——即寻找并利用适当的工具来解决问题，而不是直接依靠自身能力去解决。

2、OpenAI 对 AIAgent 的定义

在2023年6月，Open AI 的应用研究主管 Lilian Weng发表了《LLM Powered Autonomous Agents》一文，其中她提出了一个公式：“智能体=大模型（LLMs）+规划（Planning）+记忆（Memory）+工具使用（Tools）”。

1）智能体的推理与执行能力，指的是利用大模型（LLMs）来理解、执行并回顾任务。这包括将复杂任务分解为更小、更易管理的子任务以提高效率，并且通过吸取历史经验和错误教训来优化行动的质量。

2）智能体具备短期与长期记忆功能：短期记忆通过利用提示（Prompt）中的信息和上下文数据进行学习，而长期记忆则通过外部向量存储和快速检索技术来实现，这使得智能体能够在更广泛的时间跨度内存储和回忆（理论上无限）信息。

3）智能体具有调用外部 API 来使用“工具”的能力，这包括浏览网页、启动应用程序、读写文件、进行支付甚至操控用户设备等。与传统的自动化工具不同，AI智能体能够在未知和不可预测的新环境中有效工作。

4）在Open AI 的定义基础上，还应补充智能体的反馈接受能力。正如人类在处理复杂任务时需要与环境互动，我们的行为会改变环境，环境也会给予我们反馈，我们根据这些反馈进行决策。因此，智能体应该能够根据采取的行动接收正面或试错性的反馈、阶段性成果或奖励，并据此进行下一轮的规划和行动。

3、AI Agent 更广泛的定义

在 AI Agent 的整体架构设计中，一般可以将框架划分为五个主要模块：感知、定义、记忆、规划和行动。

二、AI Agent 的关键能力要素

1、记忆能力

目前的研究普遍将记忆分为短期记忆和长期记忆两大类。

2、规划能力

规划是 AI Agent 解决复杂问题的关键能力，主要包括子目标分解、反思和提炼等。

3、行动能力

智能体的行动能力主要体现在文本输出、工具使用和具身动作等方面。

4、减少幻觉

减少幻觉主要依赖于基础模型的进步和 Scaling Law，同时也有工程方法可以减少现有模型的幻觉。

三、AI Agent 发展的三个阶段

1、AI Agent 能力的三个发展阶段

1) Embedding 嵌入式模式：这一阶段主要依赖于人类问答，提供信息和建议，这是目前最普遍的大模型（LLM）应用方式。

2) Copilot 辅助驾驶模式：在这一阶段，Agent 基于人类设定的目标，完成单一或简单任务。

3) Agent 智能体模式：智能体在这一阶段能够基于人类的目标，执行多任务、复杂任务或任务组合。

2、ChatGPT 代表了第一阶段的大模型能力。

它并不完全符合 Agent 的典型定义，主要向用户提供广泛的世界知识。

3、目前，单一任务场景下已有一些AI 应用实例

在办公场景中，我们有 Microsoft 365 Copilot（及其新推出的个人版 Copilot Pro）、Google Duet AI、专注于轻文档办公的 Notion AI、辅助代码开发的 Copilot X 以及数据分析处理的 Deepnote AI 等。这些应用常见的功能包括起草文档、内容汇总、提供公式建议等，它们通常以侧边栏或对话框的形式出现，帮助用户自动调用工作空间中的文件和信息，并进行处理生成。

4、展望未来，AI Agent 将不仅仅局限于解决问题的执行层面，而是将进一步深入到如何解决问题的规划层面。

在工作场景中，我们对 AI Agent 的期待包括：

1) 连续执行：Agent 能够对用户的任务指令进行拆解，分解为多个步骤，对这些步骤进行规划排序并连续执行。

2) 完成复杂任务：目前 Agent 只能解决单个或少数简单任务，未来期望能够处理多个复杂任务。

3) 多步骤规划：Agent 在执行后续步骤的同时，能够保持对任务目标和前序任务的记忆，具备强大的步骤规划执行能力。

原文链接：

本网站的文章部分内容可能来源于网络和网友发布，仅供大家学习与参考，如有侵权，请联系站长进行删除处理，不代表本网站立场，转载者并注明出处：https://jmbhsh.com/yule/33169.html