忘掉 ChatBots 将是未来 AI 智能体 Agents

随着AI Agents技术的不断发展和成熟，我们可以期待在未来看到更多令人兴奋的创新和应用。这些技术有望成为推动人类进步和提高生活质量的重要工具。

本周，一家名为Cognition AI的初创公司引起了轰动，他们发布了一个演示，展示了一个名为Devin的人工智能程序执行通常由高薪软件工程师完成的工作。像ChatGPT和Gemini这样的聊天机器人可以生成代码，但Devin更进一步，规划解决问题的方法，编写代码，然后测试和实施。

Devin的创建者将其定位为“AI软件开发人员”。当被要求测试Meta的开源语言模型Llama 2在通过不同公司主机访问时的性能时，Devin生成了一个逐步的项目计划，生成了访问API并运行基准测试所需的代码，并创建了一个总结结果的网站。

评估经过策划的演示总是很困难，但Cognition展示了Devin处理各种令人印象深刻的任务。它在推特上让投资者和工程师们赞叹不已，获得了许多认可，甚至激发了一些预测Devin将很快导致技术行业裁员浪潮的到来。

Devin只是我一直在追踪的趋势的最新、最精致的例子——即出现了能够采取行动来解决问题，而不仅仅是提供人类所提出问题的答案或建议的AI Agents。几个月前，我试驾了Auto-GPT，这是一个开源程序，试图通过在用户的计算机和网络上采取行动来完成有用的任务。最近，我测试了另一个名为vimGPT的程序，以了解新的AI模型的视觉技能如何帮助这些Agents更高效地浏览网络。

我对这些Agents的实验结果印象深刻。然而，就像为它们提供动力的语言模型一样，它们现在还存在相当多的错误。当一款软件正在采取行动，而不仅仅是生成文本时，一个错误可能意味着彻底失败——并可能带来昂贵或危险的后果。将Agents能够执行的任务范围缩小到特定的软件工程任务集合，似乎是降低错误率的聪明方式，但仍然存在许多潜在的失败方式。

不仅仅是初创公司在构建AI Agents。本周早些时候，我写了一篇关于由Google DeepMind开发的名为SIMA的Agents的文章，该Agents玩的视频游戏包括真正疯狂的标题《Goat Simulator 3》。SIMA通过观察人类玩家学会了如何执行600多项相当复杂的任务，例如砍树或击中小行星。最重要的是，即使在陌生的游戏中，它也能成功地执行许多这些动作。Google DeepMind称之为“通才”。

我怀疑Google希望这些Agents最终能够在视频游戏之外的领域发挥作用，也许是帮助用户代表他们使用网络或操作软件。但视频游戏为开发和测试Agents提供了一个良好的沙盒环境，因为它们提供了复杂的环境，可以在其中对Agents进行测试和改进。“使它们更加精确是我们正在积极努力的事情，”Google DeepMind的研究科学家Tim Harley告诉我。“我们有各种各样的想法。”

在接下来的几个月里，你可以期待更多关于AI Agents的新闻。Google DeepMind的CEO Demis Hassabis最近告诉我，他计划将大型语言模型与公司先前训练AI程序玩视频游戏的工作相结合，以开发更具能力和可靠性的Agents。“这绝对是一个巨大的领域。我们正在大力投资这个方向，我想其他公司也在这样做，”Hassabis说道。“当它们开始变得更像Agents时，这将是这些类型系统能力的一个重大飞跃。”

本文转载自，作者：

本网站的文章部分内容可能来源于网络和网友发布，仅供大家学习与参考，如有侵权，请联系站长进行删除处理，不代表本网站立场，转载者并注明出处：https://jmbhsh.com/wanjumoxing/33491.html

忘掉 ChatBots 将是未来 AI 智能体 Agents

相关推荐

联系我们