多智能体 执行-辩论-校验 闭环架构

📅 2026/7/4 9:44:12 👁️ 阅读次数 📝 编程学习
多智能体 执行-辩论-校验 闭环架构

文章目录

    • 一、核心本质
    • 二、三大智能体权责划分
      • 1. 执行Agent(A/B/C)
      • 2. 辩论Agent
      • 3. 校验Agent(终审裁判)
    • 三、闭环流转逻辑
    • 四、关键设计规则
    • 五、TaskList 任务标准字段

一、核心本质

整体架构本质:执行 → 辩论 → 校验 三节点闭环循环
规划层只做首次大任务拆分,不参与内部循环迭代。

二、三大智能体权责划分

1. 执行Agent(A/B/C)

  • 读取任务队列tasklist
  • 按任务描述/入参执行
  • 执行结果、状态、日志回填到 State
  • 若有modify_info,优先按修正后内容执行

2. 辩论Agent

  • 只读全局State.tasklist任务全量记录与执行结果
  • 负责挑错、质疑、反向推演、找逻辑漏洞
  • 仅输出:疑点、问题原因、修改建议
  • 只有建议权,无判决权、无直接修改权

3. 校验Agent(终审裁判)

  • 复核任务执行本身是否合理
  • 裁决辩论Agent的质疑是否成立
  • 三种裁决分支:
    1. 无问题 / 辩论无理抬杠 → 流程结束
    2. 确实存在问题 → 确认修改信息,重置子任务,重新入队重回执行
    3. 单任务重跑超上限 → 标记异常、强制终止,防死循环

三、闭环流转逻辑

  1. 规划拆分任务 → 生成 tasklist
  2. 任务入队 → 执行Agent执行并回填结果
  3. 执行完毕 → 进入辩论Agent复盘挑错
  4. 辩论完成 → 进入校验Agent终审
  5. 校验通过 → 结束流程
  6. 校验判定有问题 → 携带最终修改信息局部任务重入队列 → 回到执行节点
  7. 形成:执行 ↔ 辩论 ↔ 校验循环

四、关键设计规则

  1. 重跑必须携带修改信息,否则重复跑无意义
  2. 辩论只提建议,校验才是唯一拍板者,防止把对的改错
  3. 只做局部子任务重跑,不退回规划层重拆全局任务
  4. 限制单任务最大重跑次数,避免无限循环

五、TaskList 任务标准字段

{"task_id":"","task_desc":"","input_params":{},"executor":"","status":"待执行/已完成/异常","exec_result":"","retry_count":0,"max_retry":2,"modify_info":{"modify_reason":"","old_content":"","new_content":""}}