AI大模型各类概念扫盲

以下内容整理自AI,进行一个概念扫盲:

  • Prompt(提示词)
    Prompt是用户提供给AI模型的指令或问题,用于引导模型生成特定输出。良好的Prompt设计能显著提升模型的任务理解能力和响应质量,例如通过结构化提示(Few-shot Prompting)让模型学习上下文中的示例,或使用思维链(Chain-of-Thought)提示引导模型分步推理。在Agent开发中,Prompt是控制行为的第一环,直接影响任务拆解、工具调用和结果生成的准确性。

  • RAG(检索增强生成)
    RAG通过结合实时检索和文本生成技术,让模型在回答时参考外部知识库的最新信息,解决静态模型的知识局限性。其核心流程包括:将用户查询转换为向量,从向量数据库中检索相关文档片段,再基于检索内容生成回答。这种技术广泛应用于客服、医疗问答等需要实时数据的场景,能有效减少模型幻觉。

  • Embedding(嵌入向量)
    Embedding是将文本、图像等数据映射为高维向量的技术,这些向量能捕捉语义特征(如“猫”和“狗”的向量相似度高于“猫”和“汽车”)。通过对比向量距离,可实现语义搜索、聚类和推荐。常用模型如OpenAI的text-embedding-ada-002或开源的Sentence-BERT,它们是构建RAG、记忆系统的基础工具。

  • 向量数据库
    向量数据库(如Pinecone、Milvus)专为存储和检索高维向量优化,支持高效的相似度搜索。与传统数据库不同,它通过近似最近邻(ANN)算法快速找到语义相似的条目,适合处理非结构化数据。在Agent中,向量数据库用于存储知识库Embedding或用户交互历史,实现快速上下文检索。

  • 召回率
    召回率衡量检索系统覆盖相关结果的能力,计算为“正确检索到的相关项/所有相关项”。高召回率意味着系统遗漏较少,适用于需全面性的场景(如法律条文查询)。实际应用中需与精确率(Precision)平衡,例如通过调整检索阈值或结合重排序(Re-ranking)技术提升效果。

  • Top_K与Top_p
    Top_K限制生成时仅从概率最高的K个候选词中采样,适合需要确定性的任务;Top_p(核采样)动态选择累积概率超过p的最小词集,增强多样性。两者共同控制生成结果的创造性,例如客服场景用低Top_p保证严谨性,而创意写作可用高Top_p激发灵感。

  • 温度(Temperature)
    温度参数调节生成随机性:高温(如1.0)增加多样性但可能偏离事实,低温(如0.2)使输出更确定但缺乏新意。在Agent中,需根据任务调整——事实查询用低温,诗歌生成用高温,而对话系统可能选择中间值(0.7)平衡流畅性与准确性。

  • Memory(记忆)
    Memory使Agent能存储和利用历史信息,分为短期记忆(如对话上下文缓存)和长期记忆(如向量化的用户偏好)。实现方式包括:数据库存储结构化数据、向量库保存语义记忆,或通过递归摘要(Recursive Summarization)压缩长上下文。记忆机制是个性化服务的核心。

  • MCP(Model Context Protocol)
    MCP是一种系统性管理AI模型交互上下文的框架协议,旨在通过结构化上下文传递和状态维护来增强复杂任务中模型的连贯性与可控性。其核心是通过标准化接口(如JSON Schema)定义对话历史、环境状态、工具调用结果等上下文要素,使模型能动态跟踪多轮交互的完整信息流。例如,在客服Agent场景中,MCP会记录用户历史问题、已尝试的解决方案、系统反馈等元数据,形成可追溯的任务图谱;在自动化流程中,它可协调多个子模型间的上下文传递,确保链式调用(如检索→分析→执行)的信息一致性。该协议通常与记忆模块(Memory)、函数调用(Function Call)深度集成,既能解决长上下文窗口的容量限制问题(通过分层存储关键信息),也能减少因上下文丢失导致的模型幻觉或逻辑断层,是构建企业级Agent系统的底层支撑技术之一。

  • Function Call(函数调用)
    Function Call允许模型调用外部工具(如API、数据库)扩展能力,例如查询天气或执行数学计算。OpenAI等平台提供结构化函数描述,模型根据需求自动触发调用。这是Agent实现复杂任务(如订机票、数据分析)的关键技术。

  • 模型幻觉
    模型幻觉指生成内容与事实或逻辑不符,成因包括训练数据偏差、过度依赖参数化知识。缓解方法包括:RAG提供真实依据、设置低温/低Top_p限制随机性、添加事后验证(如事实性检查API)以及多步推理(Self-Consistency)。

  • 模型微调
    微调是在领域数据上继续训练预训练模型,使其适应特定任务(如法律文本分析)。相比Prompt工程,微调能更深度调整模型行为,但需标注数据和算力支持。轻量级方法如LoRA(低秩适应)可降低资源消耗。

  • 链式调用
    链式调用将多个步骤串联成工作流,例如“检索→生成→验证→执行”。框架如LangChain提供标准化接口,支持灵活组合工具和模型。复杂Agent可能嵌套多条链,如先规划任务步骤,再逐步调用子链完成。

  • Agent(智能代理)
    Agent是整合感知、决策与执行的自主系统,核心能力包括:通过Prompt和Memory理解上下文,利用Function Call调用工具,基于RAG获取实时知识,并通过链式调用协调多步骤任务。高级Agent还能通过强化学习(RLHF)从反馈中持续优化行为。

总的来说,在人工智能领域,Prompt是指用户输入给模型的指令或问题,它直接影响模型的输出质量和方向,好的Prompt设计能显著提升任务完成效果。RAG(检索增强生成)是一种结合信息检索和文本生成的技术,通过从外部知识库实时获取相关信息来增强生成内容的准确性,特别适合需要实时数据的场景。Embedding技术将文本、图像等数据转化为高维向量,这些向量能够捕捉语义信息,为相似性搜索和推荐系统提供基础。向量数据库是专门为存储和检索这些嵌入向量优化的数据库,支持高效的相似度计算和大规模数据查询,是构建智能检索系统的核心组件。召回率衡量的是检索系统找到所有相关项目的能力,高召回率意味着系统很少遗漏重要信息,这在信息检索和推荐系统中尤为重要。Top_K和Top_p是控制文本生成多样性的参数,前者限制候选词范围,后者通过概率累积动态调整候选词集合,两者共同影响生成结果的创造性和准确性。温度参数调节生成过程中的随机性,较高的温度会产生更多样化的输出,而较低的温度则使结果更加确定和保守。Memory使AI系统能够记住历史交互信息,分为短期记忆(如当前会话上下文)和长期记忆(如用户偏好存储),是实现个性化服务的关键。MCP(多选提示)通过提供候选答案让模型选择最佳响应,能有效减少模型幻觉问题。Function Call允许模型调用外部工具或API来扩展能力,比如查询天气或执行计算,极大提升了Agent的功能范围。模型幻觉是指AI生成与事实不符的内容,通过RAG、参数调优和事实校验可以有效缓解。模型微调通过在特定领域数据上继续训练预训练模型,使其适应专业任务,如医疗或法律问答。链式调用将多个处理步骤串联起来,形成连贯的工作流程,常用于复杂任务的自动化处理。Agent作为智能代理,整合了上述所有技术,具备自主决策、工具调用和持续学习能力,能够完成从简单问答到复杂问题解决的全方位任务。构建高效Agent需要合理设计工作流程,选择适当的技术栈,并通过持续优化参数和评估指标来提升系统性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/2649.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 主页-评论用户名词云图实现

大家好,我是java1234_小锋老师,最近写了一套【NLP舆情分析】基于python微博舆情分析可视化系统(flaskpandasecharts)视频教程,持续更新中,计划月底更新完,感谢支持。今天讲解主页-评论用户名词云图实现 视频在线地址&…

Springmvc的自动解管理

中央转发器&#xff08;DispatcherServlet&#xff09;控制器视图解析器静态资源访问消息转换器格式化静态资源管理一、中央转发器Xml无需配置<servlet><servlet-name>chapter2</servlet-name><servlet-class>org.springframework.web.servlet.Dispatc…

JavaScript中this的5大核心规则详解

在 JavaScript 中&#xff0c;this 是一个特殊关键字&#xff0c;其值取决于函数的 调用方式 而非定义位置。它的行为遵循一套明确的规则&#xff0c;以下是核心规则和示例&#xff1a;1. 默认绑定&#xff08;独立函数调用&#xff09; 当函数独立调用时&#xff08;不作为方法…

深度分析Java内存回收机制

内存回收机制是Java区别于C/C等语言的核心特性之一&#xff0c;也是Java开发者理解程序性能、解决内存相关问题&#xff08;如内存泄漏、OOM&#xff09;的关键。 核心目标&#xff1a; 自动回收程序中不再使用的对象所占用的内存&#xff0c;防止内存耗尽&#xff0c;同时尽量…

字节 AI 编辑器 Trae 2.0 SOLO 出道! 国际版不充分指南及与国内版的对比

最近 Trae 2.0 上线&#xff0c;带来了强势的 SOLO&#xff0c;一个能自主执行开发任务的超级个体&#xff0c;集成编辑器、终端、浏览器等多工具视图于一体&#xff0c;打通从构思到落地的完整链路。 不过国内版需要预约&#xff08;饥饿营销&#xff1f;&#xff09;&#x…

二分查找----3.在排序数组中查找元素的第一个和最后一个位置

题目链接 /** 在一个近似递增的数组中查找指定元素,该元素可能有多个找出其出现的区间 单次普通二分只能查到一个元素且无法确定边界;对二分改进即可 左边界:当查到目标元素时,记录下标并将right迭代为mid-1,继续向左二分直到搜寻结束,得到左边界 右边界:当查到目标元素时,记录…

修改 Lucide-React 图标样式的方法

修改 Lucide-React 图标样式的方法 使用 lucide-react 时&#xff0c;你可以通过多种方式修改图标的样式。以下是几种常用的方法&#xff1a; 1. 通过 className 属性 import { Home } from lucide-react;function MyComponent() {return <Home className"text-blue-50…

新手向:Idea的使用技巧

为什么选择IntelliJ IDEA作为Java开发工具&#xff1f; IntelliJ IDEA被誉为Java开发者的"智能助手"&#xff0c;它就像手机里的Siri或小爱同学一样&#xff0c;能够智能地辅助开发者完成各种编程任务。 具体来说&#xff0c;IDEA具有以下突出优势&#xff1a; 智…

自动化运维:从脚本到DevOps的演进

自动化通常从编写脚本开始&#xff0c;这些脚本可以自动执行常规任务&#xff0c;如备份数据、更新软件或监控系统性能。例如&#xff0c;一个简单的Bash脚本可以定期检查磁盘空间并清理临时文件&#xff1a;#!/bin/bash # Disk Cleanup Script threshold80 # Set threshold…

Python机器学习:从零基础到项目实战

目录第一部分&#xff1a;思想与基石——万法归宗&#xff0c;筑基问道第1章&#xff1a;初探智慧之境——机器学习世界观1.1 何为学习&#xff1f;从人类学习到机器智能1.2 机器学习的“前世今生”&#xff1a;一部思想与技术的演进史1.3 为何是Python&#xff1f;——数据科学…

【kubernetes】-2 K8S的资源管理

文章目录K8S的资源管理1、资源管理方式简介1.1 陈述式管理资源的方法1.2 kubernetes 集群资源管理入口2、kubectl 常用命令2.1 集群操作2.2 资源操作2.3 项目生命周期管理2.3.1 创建2.3.2 发布2.3.3 更新2.3.4 回滚2.3.5删除3、图解服务发布阶段 1&#xff1a;外部客户端 → 节…

AWS PrivateLink方式访问Redis

问题 现在有两个不同的aws云账号&#xff0c;而且&#xff0c;这两个不同云账号&#xff0c;其中一个拥有Redis服务&#xff08;elasticache&#xff09;。现在需要通过另外一个账号的vpc内网访问另外一个账号的内网的redis服务。 解决 AWS PrivateLink方式。这样就可以通过…