# 五种多 Agent 编排方式详解

摘要:随着 AI 应用从单一 LLM 向多智能体(Multi-Agent)协作演进,如何高效协调这些智能体成为关键。本文深入浅出地介绍业界最主流的五种多 Agent 编排模式及其应用场景。

# 一、顺序编排 (The Chain / Sequential)

这是最直观、最基础的协作方式,常被称为“流水线模式”。

# 核心逻辑

就像现代工厂的装配流水线,任务沿着预定义好的路径单向流动。前一个智能体完成工作后的输出,直接作为下一个智能体的输入。各个环节环环相扣,依赖关系明确。

其工作流可以简单表示为:

InputAgent AAgent BAgent COutput\text{Input} \rightarrow \text{Agent A} \rightarrow \text{Agent B} \rightarrow \text{Agent C} \rightarrow \text{Output}

# 适用场景

非常适用于步骤固定、确定性强、不需要回头修改的标准作业流程(SOP),例如数据处理管道或审批流程。

# 实战案例:自动化公众号文章生成器

场景目标:建立一条自动化流水线,将用户提供的英文科技新闻链接,全自动转换为一篇符合中文阅读习惯、风格活泼的公众号推文。

流程拆解:

  1. 输入: 用户提供一个目标文章的 URL 链接。
  2. 第一环:信息获取(Agent A - 爬虫员)
  • 任务:访问 URL,提取网页核心正文内容,清洗掉导航栏、广告和多余的 HTML 标签。
  • 交付成果:纯净的英文文本素材。
  1. 第二环:内容翻译(Agent B - 翻译员)
  • 任务:接收英文素材,结合上下文将其翻译成流畅、准确的中文草稿。
  • 交付成果:中文文章草稿。
  1. 第三环:风格润色(Agent C - 编辑员)
  • 任务:根据预设的公众号人设,对草稿进行二次加工:优化分段结构、润色语言、起一个吸引点击的标题。
  • 最终输出:一篇可直接发布的成品推文。

# 模式特点

  • 优点:结构简单清晰,易于构建、理解和调试。
  • 缺点:鲁棒性较差。由于路径是单一线性的,存在级联效应:若源头抓取失败或产生幻觉,后续环节都会基于错误信息加工,导致整个流程失败(Garbage in, garbage out)。

# 二、并行编排 (MapReduce)

这种模式借鉴分布式计算思想,核心目的是“分而治之”,通过并行化突破单点能力或窗口限制。

# 核心逻辑

将一个巨大的复杂任务拆解为多个相互独立的子任务,分发给多个 Agent 并行处理(Map),最后将所有结果汇总整合(Reduce)。

其工作流可以简单表示为:

InputSplit{d1,d2,...}Map{r1,r2,...}ReduceOutput\text{Input} \xrightarrow{\text{Split}} \{d_1, d_2, ...\} \xrightarrow{\text{Map}} \{r_1, r_2, ...\} \xrightarrow{\text{Reduce}} \text{Output}

# 适用场景

适用于需要处理的数据量巨大或文本超长(如整本书籍、长达数小时的会议记录、海量日志),且切分后的子任务之间相互独立、互不干扰的场景。

# 实战案例:万字用户反馈分析

场景目标:作为产品经理,面对突然涌入约 10,000 条用户评论(Excel),需要快速找出核心槽点;单次输入 LLM 会超过 Token 限制。

流程拆解:

  1. 输入: 一个包含 1 万条用户评论的 Excel 文件。
  2. 预处理环:切分(Splitting)
  • 任务:系统将大文件切分成 20 个小片段,每个片段包含 500 条评论。
  • 交付成果:20 个独立的数据块。
  1. Map 阶段:并行分析(Agent A - 分析员 × 20)
  • 任务:并发启动 20 个能力一致的分析 Agent,每个 Agent 只阅读分配给它的 500 条评论,并总结该片段中的 “Top 3 问题”。
  • 交付成果:20 份局部总结报告。
  1. Reduce 阶段:全局汇总(Agent B - 汇总员)
  • 任务:接收 20 份局部报告,进行去重、合并同类项和统计分析。
  • 最终输出:一份全局核心问题报告(例如:核心槽点 1. 登录失败(占比 60%);2. UI 交互差(占比 20%))。

# 模式特点

  • 优点:效率高,可突破上下文窗口(Context Window)限制。
  • 缺点:信息可能割裂。Map 阶段各 Agent 互不沟通,若文本前后有强逻辑关联,切分后可能丢失上下文线索。

# 三、共识编排 (Consensus / Voting)

这种模式类似“专家会诊”或“模型集成”,利用多个不同视角或设定的 Agent 来解决同一个问题。

# 核心逻辑

让多个 Agent 独立生成结果,然后引入“投票机制”或“法官 Agent”来裁决,过滤掉个体的幻觉和偏见,通过群体智慧提升准确度。

其工作流可以简单表示为:

{Agent AResult AAgent BResult BAgent CResult CJudge/VoteFinal Output\begin{cases} \text{Agent A} \rightarrow \text{Result A} \\ \text{Agent B} \rightarrow \text{Result B} \\ \text{Agent C} \rightarrow \text{Result C} \end{cases} \xrightarrow{\text{Judge/Vote}} \text{Final Output}

# 适用场景

适用于高风险决策、需要高准确率、容错率低,或容易产生幻觉的复杂判断场景(如医疗建议、金融风控、法律咨询)。

# 实战案例:股票投资顾问

场景目标:用户询问是否应该买入某只波动剧烈的股票,系统需要给出全面且审慎的投资建议。

流程拆解:

  1. 输入: 用户询问“我现在是否应该买入特斯拉股票?”
  2. 并行生成环:多视角分析
  • Agent A(激进派技术分析师):侧重分析 K 线图与 RSI 指标。输出:买入,技术指标显示超卖。
  • Agent B(保守派宏观分析师):侧重分析美联储政策和市场情绪。输出:卖出,宏观环境风险极高。
  • Agent C(基本面分析师):侧重分析财报和现金流。输出:持有,估值合理但缺乏短期爆发力。
  1. 裁决环:综合决策(Agent D - 主裁决官)
  • 任务:阅读并理解上述三种观点及其论据,进行加权分析与权衡。
  • 最终输出:一份综合建议报告(例如:尽管技术面有反弹迹象,但宏观风险尚未释放,建议暂时观望(持有),不要大举加仓)。

# 模式特点

  • 优点:可靠性高。引入反对意见和多样性视角,可避免单一模型的盲目自信。
  • 缺点:成本高。需要多次调用模型,响应速度较慢,不适合实时对话场景。

# 四、分层编排 (Hierarchical / Supervisor)

这是最接近人类公司组织架构的模式,通常包含动态路由和状态管理。

# 核心逻辑

引入一个“主管(Supervisor)”Agent,它不直接执行具体工作,而是负责理解意图、拆解任务、分发给 Worker Agent,并根据 Worker 的反馈动态决定下一步操作。这是一个有状态的循环图结构。

其工作流可以简单表示为:

Supervisor{Worker A,Worker B,Worker C}\text{Supervisor} \leftrightarrows \{ \text{Worker A}, \text{Worker B}, \text{Worker C} \}

# 适用场景

适用于任务复杂、执行步骤不确定、需要根据中间结果动态调整后续计划的场景(如复杂的助理任务、软件开发)。

# 实战案例:智能旅行行程规划

场景目标:用户提出一个模糊且复杂的旅行需求,涉及机票、酒店、餐厅,且任务间存在强依赖关系(订不到房就不能订餐厅)。

流程拆解:

  1. 输入: 用户需求“帮我订去东京的行程,要在富士山下住一晚,还要订个当地的米其林餐厅。”
  2. 规划环:Supervisor(总管)介入
  • 任务:总管分析需求,识别出需要调用航班、酒店、餐厅三个专业 Agent,并规划第一步:调用航班 Agent。
  1. 执行环 1:航班预订(Worker A)
  • 反馈:向总管汇报“已查询 X 月 X 日的航班并锁定”。
  1. 执行环 2:酒店预订(Worker B)
  • 反馈:向总管汇报“失败,指定日期的富士山酒店已满房”。
  1. 动态调整环:Supervisor 重规划
  • 任务:总管接收到失败反馈,意识到原计划不可行。它不会报错退出,而是动态指令航班 Agent 改查下周的机票,随后再次尝试预订酒店。
  • 最终输出:经过多轮动态调整,向用户输出一份完整、闭环的行程单。

# 模式特点

  • 优点:灵活性强。Supervisor 具备全局视野和状态记忆,能够处理异常情况和复杂的依赖逻辑。
  • 缺点:存在单点瓶颈。系统表现高度依赖 Supervisor 的推理能力,若分配错误可能导致死循环。

# 五、制作-检查者编排 (Producer-Reviewer / Reflexion)

这种模式建立了内容生成与质量控制的闭环反馈机制,常用于提升 LLM 输出质量。

# 核心逻辑

包含一个“生成-评估”的迭代循环:制作者负责生成内容,检查者负责挑刺并提出修改建议;若质量不达标,则将意见回传给制作者重写,直到满足条件。

其工作流可以简单表示为:

GenerateDraftCritiqueFeedbackRefineLoop...Final Output\text{Generate} \xrightarrow{\text{Draft}} \text{Critique} \xrightarrow{\text{Feedback}} \text{Refine} \xrightarrow{\text{Loop...}} \text{Final Output}

# 适用场景

适用于对输出质量要求极高的场景,如代码生成(Coding)、数学解题、长篇小说创作或法律文书撰写。

# 实战案例:Python 代码生成助手

场景目标:用户要求写一个贪吃蛇游戏的代码,一次性生成的代码往往无法直接运行。

流程拆解:

  1. 输入: 用户需求“写一个 Python 贪吃蛇游戏”。
  2. 第一环:生成(Agent A - 程序员)
  • 任务:编写初始代码。
  • 交付成果:代码版本 V1。
  1. 第二环:评估(Agent B - 测试员/编译器)
  • 任务:模拟运行代码,进行静态分析或执行测试。
  • 反馈意见:发现第 30 行存在索引越界错误,且蛇撞墙后游戏未结束。
  1. 第三环:修正(Agent A - 程序员)
  • 任务:读取测试员的反馈,针对性修复 Bug。
  • 交付成果:代码版本 V2。
  1. 循环终止:再次测试通过,或达到最大重试次数。
  • 最终输出:一段无 Bug、可运行的贪吃蛇代码。

# 模式特点

  • 优点:自我修正。通过迭代反馈机制,让模型有机会审视自己的错误,显著提升最终产出的可用性。
  • 缺点:可能陷入死循环。若制作者能力不足,可能一直达不到检查者标准,系统会无限运行;通常需要设置最大迭代次数(Max Iterations)。