大模型语言系列-Agent

文章目录

前言
一、Agent是什么？
二、LLM Agent
- 1.西部世界小镇Agent
- 2.BabyAGI
- 3.AutoGPT
- 4.Voyager Agent
总结

前言

自2022年ChatGPT诞生以来，LLM获得了收获了大量关注和研究，但究其根本，技术还是要为应用服务，如何将LLM应用于实际的业务场景成为了诸多工程师思考的问题。

从ChatGPT引入强化学习以来，基于LLM的Agent（智能体）概念再次火爆起来，本文旨在对Agent的起源、发展、现状进行一定程度的探究。

一、Agent是什么？

Agent（智能体）概念最早由人工智能领域的研究者提出，旨在模拟人类的智能行为。最初的Agent系统主要集中在解决特定问题或领域，如专家系统、规则引擎等。

20世纪80年代末和90年代初，随着计算机和网络技术的发展，Agent开始融入到各种应用中，如搜索引擎、个人助理等。

强化学习等技术的兴起（2014年起，深度强化学习出现）使得Agent能够通过与环境的交互来学习和优化其行为。

直到现在，基于LLM和深度强化学习结合的Agent已经成为人工智能领域的核心研究方向之一，涉及到智能系统、机器人、游戏、自动化等多个领域。

简而言之，现在的Agent就是LLM + Planning + Memory + Tools，让大模型实现任务自动化，并且能够不断探索、规划和发展新技能。

下面举几个LLM Agent案例。

二、LLM Agent

1.西部世界小镇Agent

2023年3月，斯坦福制作了西部世界小镇Agent，构建出了一个虚拟小镇，让25个AI智能体在其中生存、从事复杂行为。
在这里插入图片描述

为了生成智能体，研究者提出了一种全新架构，它扩展了大语言模型，能够使用自然语言存储Agent的经历。随着时间的推移，这些记忆会被合成为更高级别的反射，智能体可以动态检索它们，来规划自己的行为。最终，用户可以使用自然语言和全镇的25个Agent都实现交互。

在这里插入图片描述
如上，生成式智能体的架构实现了一个记忆「检索」（Retrieve）功能，这一功能将智能体的当前情况/感知（Perceive）作为输入，并返回记忆流（Memory Stream）的一个子集（Retrieved Memories）传递给语言模型，而检索功能有多种可能的实现方式，具体取决于智能体在决定如何行动时考虑的重要因素。

生成式智能体架构面临一个核心挑战，就是如何管理大量必须保留的事件和记忆。为了解决这个问题，架构的核心是记忆流（Memory Stream），即一个记录智能体全部经验的数据库。智能体可以从记忆流中检索相关记忆，这有助于它规划行动，做出正确反应，并且每次行动都会反馈记录到记忆流中，以便递归地改进未来行动。
此外，研究还引入了第二种类型的记忆——反思（Reflect）。反思是智能体根据最近经历生成的高级抽象思考。反思是周期性触发的过程，只有当智能体判断最近一系列事件的重要性评分，累积超过设定阈值时，才会启动反思机制。
生成式智能体为了创建合理的规划（Plan），它们会自上而下递归生成更多的细节。这些规划最初只是粗略的描述了当日所要做的事情。在执行规划的过程中，生成智能体会持续感知周围环境，并将感知到的观察结果存储到记忆流中。通过利用观察结果作为提示，让语言模型决定智能体下一步行动：继续执行当前规划，还是做出其他反应。

作者对该框架采用了两种评估方式：控制评估，以及端到端的评估：

控制评估：是为了了解智能体能否独立产生可信个体行为。
端到端评估：是为了了解智能体的涌现能力以及稳定性。

2.BabyAGI

BabyAGI是一个智能个人任务管理和解决工具。

BabyAGI背后的脚本非常简单（不要让看似复杂的图表欺骗你）。它本质上是一个与任务列表交互的语言模型，目的是根据预定义的目标自动生成任务、确定任务的优先级和执行任务。

BabyAG结合了OpenAI GPT-4和Pinecone向量搜索引擎的力量，以自动完成和管理一系列任务

从一个初始任务开始，BabyAGI使用GPT4生成解决方案和新任务，并将解决方案存储在Pinecone中以便进一步检索。
BabyAGI根据先前任务的结果和预定义的目标创建新任务，并使用 Pinecone 存储和检索上下文的任务结果。

通过迭代这个过程，babyagi不断为用户解决问题，并生成新的相关任务，这使得用户可以更高效地解决复杂的问题，专注于实现更高层次的目标，同时，Pinecone向量搜索引擎的使用确保了解决方案的组织和快速检索。具体流程如下图：
在这里插入图片描述

有用户指定需要解决的问题也就是Objective，比如<如何解决世界饥荒问题>
根据用户给出的问题创建第一个需要解决的任务并插入系统任务列表当中：一个关于解决<如何解决世界饥荒问题>的任务列表
向OpenAI GPT-4发送一个请求，以获取如何解决世界饥饿问题的任务列表。请求时，提供目标（Objective）和第一个任务（First Task）
将OpenAI GPT-4生成的任务及其相关信息保存到Pinecone向量索引中
从Pinecone向量索引中检索任务及其相关信息，并将结果打印到控制台
继续提取任务进行执行，直到GPT-4无法生成新任务为止。换句话说，当GPT-4生成的任务已经在tasks列表中时，程序将中止。这意味着所有已分配的任务已经解决，不再有新任务生成

在这里插入图片描述