AI智能体内存架构：从短期记忆到长期记忆的工程实现

📅 2026/7/5 11:18:15 👁️ 阅读次数 📝 编程学习

🚀 30+款热门AI模型一站整合，DeepSeek/GLM/Qwen 随心用，限时 5 折。 👉 点击领海量免费额度

这次我们来看一个关于 AI 智能体核心能力的话题：智能体的内存架构。这不是一个具体的开源项目，而是构建和评估任何 AI 智能体系统时都必须理解的基础设施层。简单来说，它决定了你的智能体是“金鱼脑”（说完就忘）还是“老专家”（能记住你的习惯，并从历史经验中学习）。对于开发者而言，理解内存架构直接关系到你能否设计出真正有用、能持续进化的智能体应用，而不是一个只会单轮对话的聊天机器人。

本文的核心是拆解智能体内存的构成、实现方式以及如何在实际项目中应用。我们将从最基础的短期记忆（上下文窗口）讲起，深入到长期记忆（向量数据库、知识图谱）、情景记忆（事件记录）等高级概念，并结合 LangChain、LangGraph 等主流框架，展示如何为你的智能体“安装”一个高效、可扩展的记忆系统。无论你是想用 Dify、Coze 等低代码平台快速搭建智能体，还是希望基于 AutoGen、CrewAI 等框架进行深度开发，理解内存架构都是绕不开的一步。

文章将重点解决几个实际问题：智能体记忆有哪些类型？它们各自解决什么问题？在工程上如何实现？需要哪些技术栈（如向量数据库）？内存管理如何影响智能体的性能和成本？我们将通过概念解析、架构对比和简明的代码示例，让你能快速评估不同内存方案，并为自己的智能体项目选择合适的技术路径。

1. 核心能力速览：智能体记忆系统

在深入细节之前，我们先通过一个表格快速了解智能体记忆系统的核心要素。这能帮你快速判断不同记忆类型的作用和实现复杂度。

能力项	说明与典型实现
记忆类型	短期记忆 (STM)、长期记忆 (LTM)、情景记忆、语义记忆、程序记忆
核心功能	存储和回忆过往交互信息，实现上下文连贯、个性化服务和持续学习。
技术门槛	概念理解中等，工程实现因方案而异。从简单的内存变量到复杂的向量检索系统。
硬件依赖	无直接硬性要求。但长期记忆（如向量数据库）可能消耗额外内存/存储；语义记忆检索可能增加计算开销。
启动/集成方式	非独立服务，需作为组件集成到智能体框架（如 LangChain, AutoGen）或应用逻辑中。
接口能力	通常通过框架提供的 Memory 类接口进行读写操作，如`memory.save_context(...)`,`memory.load_memory_variables(...)`。
批量任务支持	支持。记忆系统可服务于智能体的所有任务流，批量处理时能共享或隔离记忆上下文。
适合场景	对话机器人、个性化推荐、复杂任务规划、多轮工具调用、基于历史经验的决策系统。

2. 智能体为什么需要记忆？—— 从“反射”到“认知”的跨越

一个没有记忆的 AI 智能体，就像一台只有开关功能的恒温器：它只能根据当前的温度读数决定加热或制冷。而一个拥有记忆的智能恒温器，能学习你每天早出晚归的习惯，提前调节温度，实现节能和舒适。这就是记忆带来的根本性差异：从对环境刺激的简单反射，升级为基于历史经验的主动规划和决策。

大型语言模型（LLM）本身是“无状态”的。每次调用，它都像一张白纸，仅根据本次输入的提示词（Prompt）生成响应。它不记得上一秒和你说了什么。因此，要让 LLM 扮演一个连贯的、个性化的智能体，我们必须外挂一个“记忆系统”。

这个系统的价值体现在：

会话连贯性：在多轮对话中记住用户之前提到的信息（如“我叫张三”，“我住在北京”），避免重复询问。
个性化服务：记住用户的偏好和历史行为（如喜欢科幻电影、上次购物选择了快递），提供定制化响应。
持续学习与优化：通过记录任务执行的成功与失败案例，智能体能在后续类似任务中调整策略，越用越聪明。
复杂任务分解：对于需要多步骤完成的任务（如“帮我订机票并安排接机”），记忆系统可以保存任务状态和中间结果，确保流程不中断。

3. 智能体记忆的五种类型：从短期到长期

借鉴认知心理学，研究社区（如普林斯顿大学的 CoALA 框架）通常将智能体记忆分为以下五类。理解它们是设计内存架构的基础。

3.1 短期记忆 (Short-Term Memory, STM)

是什么：存储最近有限次交互的信息，用于维持单次会话或短期任务的上下文。
如何工作：通常实现为一个“滑动窗口”或“滚动缓冲区”。新的信息进来，旧的信息被挤出。LLM 的上下文窗口（Context Window）本身就是一种短期记忆的物理限制。
典型应用：所有聊天对话场景。例如，ChatGPT 在一个会话标签页内能记住你之前的所有对话。
实现示例：在 LangChain 中，ConversationBufferMemory或ConversationBufferWindowMemory（可设置窗口大小）就是短期记忆的典型实现。

# LangChain 短期记忆示例 (ConversationBufferWindowMemory) from langchain.memory import ConversationBufferWindowMemory memory = ConversationBufferWindowMemory(k=2) # 只保留最近2轮对话 memory.save_context({"input": "你好，我叫李雷"}, {"output": "你好李雷！"}) memory.save_context({"input": "我今天天气不错"}, {"output": "是的，适合出门。"}) memory.save_context({"input": "我喜欢编程"}, {"output": "很棒的兴趣！"}) # 此时，记忆里只剩下最后两轮 print(memory.load_memory_variables({})) # 输出可能类似：{'history': 'Human: 我今天天气不错\nAI: 是的，适合出门。\nHuman: 我喜欢编程\nAI: 很棒的兴趣！'}

3.2 长期记忆 (Long-Term Memory, LTM)

是什么：跨会话持久化存储信息，使智能体能够进行长期个性化交互和学习。
如何工作：将信息转换为向量（Embeddings）后存入向量数据库（如 Chroma, Pinecone, Weaviate），或使用传统数据库、知识图谱存储结构化信息。需要时通过检索（Retrieval）获取。
典型应用：个人知识库助手、客户支持系统（记住客户历史工单）、个性化推荐引擎。
关键技术：检索增强生成（RAG）是连接 LLM 与长期记忆的核心技术。智能体先从长期记忆中检索出相关历史信息，再连同当前问题一起交给 LLM 生成答案。

3.3 情景记忆 (Episodic Memory)

是什么：存储智能体自身经历的特定事件序列，包括时间、地点、动作和结果。
如何工作：以结构化的日志或时间序列形式记录（例如，在 SQL 数据库或文档数据库中记录时间戳，事件，状态，结果）。在需要复盘或进行类比推理时进行查询。
典型应用：游戏 AI（记住之前的战斗策略）、交易机器人（分析历史交易记录）、自主机器人（从失败的导航尝试中学习）。
与 LTM 的区别：LTM 更偏向于存储“事实知识”，而情景记忆存储的是“亲身经历的事件”。

3.4 语义记忆 (Semantic Memory)

是什么：存储关于世界的一般性事实、概念、规则和关系（即常识和领域知识）。
如何工作：通常通过知识图谱（存储实体和关系）或经过精心整理的向量化文档库来实现。它为智能体提供推理所需的背景知识。
典型应用：法律咨询助手（存储法律条文和判例）、医疗诊断系统（存储疾病症状和药品知识）、企业知识管理问答。
实现提示：语义记忆库的构建质量（准确性、完整性、更新频率）直接决定智能体专业能力的上限。

3.5 程序记忆 (Procedural Memory)

是什么：存储“如何做”的技能和流程，使智能体能够自动化执行复杂任务而无需每一步都重新规划。
如何工作：可以通过记录成功的工作流（Workflow）、微调模型使其擅长特定任务序列，或使用强化学习来优化策略并固化。
典型应用：自动化脚本生成、机器人动作规划、复杂的多步骤业务流程自动化（如：数据提取 -> 清洗 -> 分析 -> 报告生成）。
高级形态：在智能体框架中，这常常体现为可复用的“工具（Tools）”组合或“技能（Skills）”。

4. 工程实现：主流框架中的记忆组件

理论需要落地。我们来看如何在流行的智能体开发框架中集成和使用记忆系统。

4.1 LangChain 中的记忆集成

LangChain 提供了最丰富的记忆组件，开箱即用。

from langchain.chains import ConversationChain from langchain.memory import ConversationSummaryMemory, CombinedMemory, ConversationBufferMemory from langchain_community.llms import Ollama # 示例使用本地 Ollama # 1. 基础缓冲区记忆 buffer_memory = ConversationBufferMemory() # 2. 摘要记忆 - 适用于长对话，将历史压缩成摘要，节省token summary_memory = ConversationSummaryMemory(llm=Ollama(model="qwen2.5:7b")) # 3. 组合记忆 - 可以同时使用多种记忆 combined_memory = CombinedMemory(memories=[buffer_memory, summary_memory]) # 4. 向量存储记忆 - 实现长期记忆/语义记忆 from langchain.memory import VectorStoreRetrieverMemory from langchain_community.vectorstores import Chroma from langchain_community.embeddings import OllamaEmbeddings embeddings = OllamaEmbeddings(model="nomic-embed-text") vectorstore = Chroma(embedding_function=embeddings, persist_directory="./chroma_db") retriever = vectorstore.as_retriever(search_kwargs=dict(k=3)) vector_memory = VectorStoreRetrieverMemory(retriever=retriever) # 创建带有记忆的对话链 llm = Ollama(model="qwen2.5:7b") conversation = ConversationChain( llm=llm, memory=combined_memory, # 或 vector_memory verbose=True ) # 进行对话，记忆会自动保存和加载 response = conversation.predict(input="你好，请记住我最喜欢的颜色是蓝色。") print(response) response2 = conversation.predict(input="我刚才说我喜欢的颜色是什么？") print(response2) # 智能体应该能回答“蓝色”

4.2 LangGraph 与记忆图

LangGraph 擅长构建有状态的、多步骤的智能体工作流。其状态（State）本身就是一个强大的记忆容器，可以贯穿整个工作流的生命周期。

from typing import TypedDict, Annotated from langgraph.graph import StateGraph, END import operator # 1. 定义状态结构，这是智能体的“记忆蓝图” class AgentState(TypedDict): messages: Annotated[list, operator.add] # 对话消息历史 user_profile: dict # 用户画像（长期记忆） current_task: str # 当前任务（情景记忆） known_facts: list # 已知事实（语义记忆） # 2. 构建图，每个节点可以读写 State graph_builder = StateGraph(AgentState) def node_remember_user(state: AgentState): """一个节点：从输入中提取并更新用户信息到长期记忆""" latest_message = state[“messages”][-1] if “我叫” in latest_message.content: name = latest_message.content.split(“我叫”)[-1].strip() state[“user_profile”][“name”] = name state[“known_facts”].append(f“用户的名字是{name}”) return state def node_plan_task(state: AgentState): """另一个节点：基于记忆（用户信息、已知事实）规划任务""" user_name = state[“user_profile”].get(“name”, “用户”) # 利用记忆进行规划... state[“current_task”] = f“为{user_name}生成个性化推荐” return state # 添加节点和边 graph_builder.add_node(“remember”, node_remember_user) graph_builder.add_node(“plan”, node_plan_task) graph_builder.set_entry_point(“remember”) graph_builder.add_edge(“remember”, “plan”) graph_builder.add_edge(“plan”, END) # 编译并运行图 graph = graph_builder.compile() initial_state = {“messages”: [{“role”: “user”, “content”: “我叫张三”}], “user_profile”: {}, “current_task”: “”, “known_facts”: []} final_state = graph.invoke(initial_state) print(final_state[“user_profile”]) # 输出: {‘name’: ‘张三’} print(final_state[“current_task”]) # 输出: ‘为张三生成个性化推荐’

4.3 自定义记忆系统架构

对于复杂场景，你可能需要自建记忆系统。一个典型的架构如下：

用户输入 | v [记忆检索器] | (查询) v [记忆存储层] |--- 向量数据库 (长期/语义记忆) |--- SQL/NoSQL 数据库 (情景记忆/用户数据) |--- 缓存/内存 (短期记忆) | v [记忆融合与排序] -> 生成增强的Prompt | v [大语言模型 LLM] | v 生成响应 | v [记忆写入器] -> 更新记忆存储层

关键决策点：

存储选择：短期记忆用 Redis 或内存；长期知识用向量数据库；结构化事件用 PostgreSQL。
检索策略：对于向量存储，关键是设计好的 Embedding 模型和检索算法（如相似度搜索、最大边际相关性 MMR）。
记忆更新：何时写入新记忆？是每条交互都存，还是过滤后存？如何避免存储垃圾信息？
记忆衰减：是否需要设计遗忘机制？例如，给记忆条目添加“权重”或“有效期”，随时间衰减。

5. 实战：为任务规划智能体添加记忆

假设我们要构建一个“旅行规划智能体”。它需要记忆用户的偏好、历史查询，并能参考过去的成功规划案例。

步骤 1: 定义记忆结构

# memory_schema.py from pydantic import BaseModel from datetime import datetime from typing import List, Optional class UserPreference(BaseModel): user_id: str preferred_budget: Optional[str] = None liked_destinations: List[str] = [] disliked_activities: List[str] = [] class TravelEpisode(BaseModel): episode_id: str user_id: str query: str plan_generated: str user_feedback: Optional[str] = None # “很好”/“不喜欢” created_at: datetime class DestinationKnowledge(BaseModel): destination_id: str name: str description: str # 向量化存储的文本 tags: List[str] best_season: str

步骤 2: 实现记忆管理器

# memory_manager.py import chromadb from chromadb.config import Settings from langchain_community.embeddings import HuggingFaceEmbeddings from sqlalchemy import create_engine, Column, String, Text, DateTime from sqlalchemy.ext.declarative import declarative_base from sqlalchemy.orm import sessionmaker import json # 1. 向量存储 - 用于目的地知识（语义记忆）和旅行计划（情景记忆的向量检索） class VectorMemory: def __init__(self, persist_path="./chroma_travel"): self.client = chromadb.PersistentClient(path=persist_path) self.embeddings = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2") # 创建或获取集合 self.knowledge_collection = self.client.get_or_create_collection(name="destination_knowledge") self.episode_collection = self.client.get_or_create_collection(name="travel_episodes") def add_destination(self, knowledge: DestinationKnowledge): self.knowledge_collection.add( documents=[knowledge.description], metadatas={"tags": json.dumps(knowledge.tags), "best_season": knowledge.best_season}, ids=[knowledge.destination_id] ) def search_similar_destinations(self, query: str, n_results=3): results = self.knowledge_collection.query( query_texts=[query], n_results=n_results ) return results # 2. 数据库存储 - 用于用户偏好和结构化情景记忆（旅行记录） Base = declarative_base() class DBUserPreference(Base): __tablename__ = ‘user_preferences’ user_id = Column(String, primary_key=True) preference_json = Column(Text) # 存储 UserPreference 的 JSON class DBTravelEpisode(Base): __tablename__ = ‘travel_episodes’ episode_id = Column(String, primary_key=True) user_id = Column(String) query = Column(Text) plan_json = Column(Text) feedback = Column(String) created_at = Column(DateTime) class DatabaseMemory: def __init__(self, db_url="sqlite:///./travel_memory.db"): self.engine = create_engine(db_url) Base.metadata.create_all(self.engine) self.Session = sessionmaker(bind=self.engine) def get_user_preference(self, user_id: str) -> Optional[UserPreference]: session = self.Session() record = session.query(DBUserPreference).filter_by(user_id=user_id).first() session.close() if record: return UserPreference.parse_raw(record.preference_json) return None def save_travel_episode(self, episode: TravelEpisode): session = self.Session() db_episode = DBTravelEpisode( episode_id=episode.episode_id, user_id=episode.user_id, query=episode.query, plan_json=episode.plan_generated, feedback=episode.user_feedback, created_at=episode.created_at ) session.merge(db_episode) session.commit() session.close()

步骤 3: 在智能体流程中调用记忆

# travel_agent.py from memory_manager import VectorMemory, DatabaseMemory from memory_schema import UserPreference, TravelEpisode from datetime import datetime import uuid class TravelPlanningAgent: def __init__(self, llm): self.llm = llm self.vector_memory = VectorMemory() self.db_memory = DatabaseMemory() def plan_trip(self, user_id: str, query: str): # 1. 检索记忆 # a. 获取用户长期偏好 user_pref = self.db_memory.get_user_preference(user_id) or UserPreference(user_id=user_id) # b. 从向量库检索相似目的地（语义记忆） similar_dests = self.vector_memory.search_similar_destinations(query) # c. 检索用户过去的成功旅行计划（情景记忆） # (这里简化，实际可从数据库查询 user_id 相关的 positive feedback 记录) # 2. 构建增强的Prompt prompt = f""" 你是一个旅行规划专家。 用户ID: {user_id} 用户历史偏好: {user_pref.dict()} 用户当前查询: {query} 相关目的地知识: {similar_dests} 请基于以上信息，生成一个详细的旅行计划。 """ # 3. 调用LLM生成计划 plan = self.llm.invoke(prompt) # 4. 保存本次交互到记忆（情景记忆） episode = TravelEpisode( episode_id=str(uuid.uuid4()), user_id=user_id, query=query, plan_generated=plan, created_at=datetime.now() ) self.db_memory.save_travel_episode(episode) # 5. （可选）根据用户后续反馈更新用户偏好（长期记忆） # feedback = get_user_feedback() # if feedback == “喜欢”: # user_pref.liked_destinations.append(extracted_destination_from_plan) # self.db_memory.update_user_preference(user_pref) return plan

6. 性能、成本与最佳实践

为智能体添加记忆不是免费的，需要权衡性能、成本和复杂性。

延迟：每次交互都进行向量检索和数据库查询会增加响应延迟。解决方案包括：
- 缓存：对频繁访问的记忆进行缓存（如用户偏好）。
- 异步写入：将记忆保存操作异步化，不阻塞主响应流程。
- 分级存储：最热的记忆放内存，温数据放向量库，冷数据放对象存储。
成本：
- 向量数据库：云服务按读取/写入单元计费，自托管需要服务器成本。
- LLM Token：检索到的记忆内容会放入 Prompt，增加 Token 消耗和 API 成本。需要做记忆的压缩和摘要。例如，用另一个 LLM 对长段历史进行总结后再存储。
记忆质量：
- 垃圾进，垃圾出：存储低质量或无关信息会污染记忆，导致后续检索结果变差。需要设计过滤和清洗逻辑。
- 记忆冲突：当新旧记忆矛盾时如何处理？可以引入置信度分数或时间衰减权重，让更新、更可靠的记忆占据主导。
安全与隐私：
- 数据隔离：确保不同用户之间的记忆严格隔离。
- 敏感信息：避免在记忆中原样存储密码、身份证号等敏感信息。必要时进行脱敏或加密。
- 合规性：遵守数据保护法规（如 GDPR），提供记忆查询和删除的接口。

7. 常见问题与排查

问题现象	可能原因	排查方式	解决方案
智能体“忘记”了之前对话的内容。	1. 记忆未正确保存。 2. 记忆检索逻辑有误，未命中。 3. 使用了`ConversationBufferWindowMemory`且窗口大小设置过小。	1. 检查调用`memory.save_context()`的代码逻辑。 2. 打印检索到的记忆内容，看是否为空或无关。 3. 检查记忆组件的配置参数。	1. 确保在对话链的适当位置保存记忆。 2. 调整向量检索的相似度阈值或检索数量（k值）。 3. 增大记忆窗口或改用`ConversationSummaryMemory`。
响应速度变慢，尤其是首次查询。	1. 向量数据库索引未预热或过大。 2. 检索返回的内容过多，导致 Prompt 过长。 3. 网络延迟（使用云端向量库）。	1. 监控向量查询耗时。 2. 检查每次检索返回的 token 数量。 3. 使用`time`模块对关键函数计时。	1. 对向量库进行预加载和索引优化。 2. 限制检索返回的文档数量或对文档进行摘要。 3. 考虑使用本地部署的轻量级向量库（如 Chroma）。
记忆检索的结果不相关，干扰了LLM判断。	1. Embedding 模型与任务不匹配。 2. 存储的文本块（chunk）过大或过小，语义不完整。 3. 元数据（metadata）未充分利用。	1. 用一组标准问题测试检索结果的相关性。 2. 检查文本分块策略。 3. 在检索时结合元数据过滤。	1. 更换或微调 Embedding 模型。 2. 优化文本分块大小和重叠（overlap）。 3. 采用混合检索（Hybrid Search），结合关键词和向量搜索。
多用户场景下，记忆串扰。	记忆存储时未区分用户 ID（session_id）。	检查保存和检索记忆的代码，是否传入了正确的用户标识符。	在记忆键（key）或数据库查询条件中强制加入用户 ID。确保记忆存储层支持多租户隔离。
长期运行后，内存或存储占用过高。	1. 记忆只增不减，没有清理机制。 2. 存储了过多冗余或低价值信息。	1. 检查数据库和向量库的数据量增长情况。 2. 分析存储的记忆内容质量。	1. 实现记忆衰减或定期清理策略（如 LRU）。 2. 设计记忆重要性评分，定期清理低分记忆。 3. 将旧记忆转移到成本更低的冷存储。

8. 总结与下一步

智能体的内存架构是其从“玩具”走向“工具”的关键。短期记忆保证了对话的流畅，长期记忆赋予了智能体个性与知识，情景记忆让它能从经验中学习，语义记忆提供了专业的背景知识，而程序记忆则实现了技能的自动化。

对于开发者来说，第一步不是追求大而全的记忆系统，而是从识别核心需求开始：

如果你的智能体只需要处理单次会话：从 LangChain 的ConversationBufferMemory开始就足够了。
如果需要记住用户跨会话的信息：引入向量数据库实现长期记忆，这是大多数实用智能体的起点。
如果智能体需要执行复杂、多步骤的任务：考虑使用 LangGraph 来管理有状态的工作流，其 State 就是天然的情景记忆载体。
如果智能体需要专业领域知识：精心构建一个高质量的语义记忆库（知识库）是成功的前提。

最容易踩的坑是过早优化和过度设计。建议先实现一个最小可用的记忆模块（例如，只用ConversationBufferMemory和简单的字典存储用户偏好），让智能体跑起来。然后通过实际使用，观察哪些记忆需求是真实存在的，再逐步引入更复杂的存储和检索机制。

下一步，你可以深入探索：

更高级的检索技术：如 RAG-Fusion、HyDE，提升记忆检索的准确率。
记忆的压缩与摘要：研究如何用更少的 Token 保留更多的信息，降低成本。
记忆的主动管理与遗忘：设计算法让智能体能自主决定记住什么、忘记什么，甚至对记忆进行反思和总结。
多智能体间的共享记忆：在 CrewAI、AutoGen 等多智能体框架中，如何设计共享的“团队记忆”或“黑板”系统。

理解并善用记忆，你的智能体将不再是一次性的问答机器，而是一个能够持续成长、不断适应你的数字伙伴。建议收藏本文，在构建下一个智能体项目时，对照文中的架构图和代码示例，为你自己的智能体装上“大脑”。

🚀 30+款热门AI模型一站整合，DeepSeek/GLM/Qwen 随心用，限时 5 折。 👉 点击领海量免费额度

编程学习技术分享实战经验

资讯详情

AI智能体内存架构：从短期记忆到长期记忆的工程实现

1. 核心能力速览：智能体记忆系统

2. 智能体为什么需要记忆？—— 从“反射”到“认知”的跨越

3. 智能体记忆的五种类型：从短期到长期

3.1 短期记忆 (Short-Term Memory, STM)

3.2 长期记忆 (Long-Term Memory, LTM)

3.3 情景记忆 (Episodic Memory)

3.4 语义记忆 (Semantic Memory)

3.5 程序记忆 (Procedural Memory)

4. 工程实现：主流框架中的记忆组件

4.1 LangChain 中的记忆集成

4.2 LangGraph 与记忆图

4.3 自定义记忆系统架构

5. 实战：为任务规划智能体添加记忆

6. 性能、成本与最佳实践

7. 常见问题与排查

8. 总结与下一步

最新新闻

日新闻

周新闻

月新闻

资讯详情

AI智能体内存架构：从短期记忆到长期记忆的工程实现

1. 核心能力速览：智能体记忆系统

2. 智能体为什么需要记忆？—— 从“反射”到“认知”的跨越

3. 智能体记忆的五种类型：从短期到长期

3.1 短期记忆 (Short-Term Memory, STM)

3.2 长期记忆 (Long-Term Memory, LTM)

3.3 情景记忆 (Episodic Memory)

3.4 语义记忆 (Semantic Memory)

3.5 程序记忆 (Procedural Memory)

4. 工程实现：主流框架中的记忆组件

4.1 LangChain 中的记忆集成

4.2 LangGraph 与记忆图

4.3 自定义记忆系统架构

5. 实战：为任务规划智能体添加记忆

6. 性能、成本与最佳实践

7. 常见问题与排查

8. 总结与下一步

相关新闻

最新新闻

日新闻

周新闻

月新闻