吴恩达老师 AI 代理工作流程的四种设计模式之二:规划

规划是 AI 智能体的一种核心设计模式,其中我们利用大语言模型 (LLM) 自主选择一系列步骤,以完成一个较大的任务。比如,如果我们指派一个智能体去网上研究某个主题,我们可能就会用 LLM 帮助它将这个大任务拆分成若干小任务,例如具体研究几个子主题、整合研究成果、以及撰写报告。

很多人在 ChatGPT 刚发布时就体验到了“ChatGPT 时刻”——他们试用了这个工具,并惊喜地发现它的能力远超过了他们对 AI 的预期。如果你还没有体验过这样的“AI 智能体时刻”,我希望你很快就会。我自己就在几个月前的一个现场演示中有过这样的经历,我展示了一个可以使用多种在线搜索工具的研究智能体。

那时,我已经在私下里多次测试过这个智能体,它总是能够利用网络搜索工具来搜集资料并进行总结。但在那次公开的演示中,网络搜索 API 突然报告了一个频率限制的错误,我本以为这次演示会当众失败,心里非常忐忑。出乎意料的是,这个智能体很机智地切换到了我曾经设定但已经忘记的维基百科搜索工具,并成功使用维基百科完成了任务。

这是一个 AI 智能体给我带来的惊喜时刻。我相信,许多还未体验过这样时刻的人们,在未来几个月里也将有机会体验到。看到一个智能体自己决定用你没有预见的方式去解决问题,并且成功了,这真是太美妙了!

有很多任务无法仅通过一个步骤或一个工具就完成。但是,智能体可以自行决定需要执行哪些步骤。举个例子,根据 HuggingGPT 的论文简化的一个例子,如果你想让一个智能体考虑一张男孩的照片,并绘制一个相同姿势的女孩,这个任务可以分为两步:

  • (一)识别男孩照片中的姿势;

  • (二)根据这个姿势来绘制女孩。

一个 LLM 可以被微调或通过少样本提示来生成一个执行计划,例如输出:

 
 
{ "tool": "pose-detection", "input": "image.jpg", "output": "temp1" }
{ "tool": "pose-to-image", "input": "temp1", "output": "final.jpg" }

这样的结构化输出定义了需要执行的两个步骤,随后会触发软件依次调用姿势检测工具和姿势转换图像工具来完成这个任务。(这只是一个示例,实际上 HuggingGPT 使用的是另一种格式。)

可以说,很多 AI 智能体的操作不必依赖于复杂的规划。例如,你可能设置一个智能体来多次反思并优化它的输出,这种情况下它的操作步骤是预定好的、一成不变的。但对于那些你不能提前定义清楚步骤的复杂任务,规划功能就显得尤为重要,它允许智能体灵活地确定接下来的行动方案。

规划功能虽然强大,却也使得结果变得不那么可预测。在我的经验中,虽然我能够通过反思和使用工具等设计模式稳定地提升应用性能,规划却还不够成熟,很难预测它的行为。不过,这个领域正在迅速进步,我相信规划的能力不久将得到大幅提升。

如果你想更深入了解如何使用大语言模型来进行规划,我推荐以下读物:

*《思维链提示促使大语言模型进行推理》(Chain-of-Thought Prompting Elicits Reasoning in Large Language Models),Wei 等(2022 年) *《HuggingGPT:用 ChatGPT 及其在 Hugging Face 中的伙伴解决 AI 任务》(HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face),Shen 等(2023 年) *《理解大语言模型智能体的规划:一项调查》(Understanding the planning of LLM agents: A survey),Huang 等(2024 年)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/555656.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

profinet协议基础

文章目录 工业以太网自动化通讯金字塔工业以太网技术比较 profinet概述profinet特性 EtherNet通信EtherCAT通信EtherCat特性EtherCat过程同步 工业以太网 工业以太网是基于IEEE 802.3 (Ethernet)的强大的区域和单元网络。 自动化通讯金字塔 各个组织与工业以太网 工业以太网…

Docker操作容器打包(commit),压缩(save),挂载(load)

文章目录 前言一、容器打包二、将镜像压缩成tar包三、将tar包挂载为镜像结束 前言 将容器打包成镜像时,你正在将应用程序及其所有依赖项、文件和配置文件捆绑到一个可移植的、独立的单元中。这样做可以确保您的应用程序在不同环境中具有一致的运行方式,…

VBA技术资料MF143:将PowerPoint中幻灯片导出为图片

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高数据的准确度。“VBA语言専攻”提供的教程一共九套,分为初级、中级、高级三大部分,教程是对VBA的系统讲解&#…

# 从浅入深 学习 SpringCloud 微服务架构(二)模拟微服务环境

从浅入深 学习 SpringCloud 微服务架构(二)模拟微服务环境(1) 段子手168 1、打开 idea 创建父工程 创建 artifactId 名为 spring_cloud_demo 的 maven 工程。 --> idea --> File --> New --> Project --> Ma…

[蓝桥杯 | 暴搜] 学会暴搜之路

虽然会调侃蓝桥杯是暴力求解的,但是本弱弱不会搜,不知道如何搜,于是写下这篇碎碎念,记录看到过的,惊艳自己的暴搜。 小总结 题目特征:很复杂的排列组合 说是暴力,其实就是枚举罢了&#xff0…

java项目的构建工具-Maven

黑马程序员JavaWeb开发教程 文章目录 一、概述1、介绍(1)介绍(2)Maven的作用(3)官网(4)仓库 2、安装 二、IDEA 集成 Maven1、配置Maven环境2、创建Maven项目(1&#xff0…

GoogleNet网络训练集和测试集搭建

测试集和训练集都是在之前搭建好的基础上进行修改的,重点记录与之前不同的代码。 还是使用的花分类的数据集进行训练和测试的。 一、训练集 1、搭建网络 设置参数:使用辅助分类器,采用权重初始化 net GoogleNet(num_classes5, aux_logi…

web--弱口令安全

字典(一种是产品初始化的密码,一种是改变的密码 对爆破密码进行加密 先这个 对账号和密码同时爆破 设置两个要用这个模式 ssh,rdp远程终端 linux的用户名为root,windows为administrator 这就被爆破了 zip,word文件猜解

【Python系列】非异步方法调用异步方法

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

Linux http协议与实现http服务器

目录 一、HTTP与URL 1、HTTP协议 2、URL 3、URL编码 4、报文与报头 报文(Message) 报头(Header) 二、HTTP(超文本传输协议)的内部运作机理 请求部分: 响应部分: 三、实现…

实验二: ping命令的使用

1.实验环境 同实验案例一环境 2.需求描述 熟悉ping命令的用法并熟悉ping命令的各种参数 3.推荐步骤 分别ping一个存在的和不存在的P 地址,观察返回的信息分别测试ping命令的相关参数 4.实验步骤 4.1、分别ping一个存在的和不存在的IP 地址 C:\>ping 192.1…

C语言如何使⽤指针?

一、问题 指针变量在初始化以后就可以使⽤和参与操作了,那么就要⽤到对指针变量最常⽤的两个操作符——> * 和 & 。 二、解答 这⾥⼜要提到始终贯穿着指针的⼀个符号“ * ”,但是这⾥的“ * ”是作为指针运算符使⽤的,叫做取内…

8个十分受小企业欢迎的电子商务网站制作工具,自助建站,一键生成免安装

如果您的小型企业需要一个网站,通常会考虑使用自助建站系统来构建与自己业务有关的电子商务站或小程序商城。 在这个时代,电子商务不仅迅速成为许多网站上的热门功能,而且几乎成为许多企业生存的必要条件,因为越来越多的人将大部分…

【C++】list的介绍及使用说明

目录 00.引言 01.list的介绍 模版类 独立节点存储 list的使用 1.构造函数 2.迭代器的使用 分类 运用 3.容量管理 empty(): size(): 4.元素访问 5.增删查改 00.引言 我们学习数据结构时,学过两个基本的数据结构:顺序表和链表。顺…

华为机考入门python3--(16)牛客16-购物单最大满意度

分类:动态规划,组合,最大值,装箱问题 知识点: 生成递减数 100, 90, 80, ..., 0 range(100, -1, -10) 访问列表的下标key for key, value in enumerate(my_list): 动态规划-捆绑装箱问题 a. 把有捆绑约束的物…

【技术变现之道】如何打造IT行业的超级个体?

前言 在当今的数字化时代,IT行业蓬勃发展,为具备技术专长的个人提供了无限的可能性。想要成为IT行业的超级个体,实现知识与技能的变现吗?以下是一些高效途径,助你一臂之力! 1. 独立接单外包 1&#xff09…

Flask项目在Pycharm中设置局域网访问

打开PyCharm导入本应用。点击Run标签中的Edit Configurations 其中Target type选择Script path,Target填入本项目中app.py的路径,Additional optional填入--host0.0.0.0(不要有空格)。 再重新运行项目,会观察到除了原本的http://127.0.0.1:50…

上线流程及操作

上节回顾 1 搜索功能-前端:搜索框,搜索结果页面-后端:一种类型课程-APIResponse(actual_courseres.data.get(results),free_course[],light_course[])-搜索,如果数据量很大,直接使用mysql,效率非常低--》E…

分类预测 | Matlab实现PSO-LSSVM粒子群算法优化最小二乘支持向量机数据分类预测

分类预测 | Matlab实现PSO-LSSVM粒子群算法优化最小二乘支持向量机数据分类预测 目录 分类预测 | Matlab实现PSO-LSSVM粒子群算法优化最小二乘支持向量机数据分类预测分类效果基本介绍程序设计参考资料 分类效果 基本介绍 1.Matlab实现PSO-LSSVM粒子群算法优化最小二乘支持向量…

FebHost:注册.CA域名的企业有什么限制?

在加拿大,只要满足加拿大互联网注册管理局的“加拿大注册要求”,任何类型的企业都可以注册.CA域名。这些要求的目的是为了确保.CA域名空间作为一个重要的公共资源得到合理的使用和开发,以促进所有加拿大人的社会和经济发展。 以下是一些主要…
最新文章