Agent —— 框架生态与选型指南

Agent 框架市场在过去两年极度碎片化,新框架几乎每周出现。本篇不追求列全,而是建立一套分类思维框架,帮助你在面对任何新框架时都能快速定位其价值。

框架(Framework)vs 产品(Product)是一个容易混淆的基本区分:框架是你用来构建东西的工具(LangChain、CrewAI),产品是你直接使用的应用(OpenClaw、nanobot、Claude Code)。本篇聚焦框架侧;OpenClaw、nanobot 等个人 Agent 产品在第七篇产品格局中讨论。

一、选框架前先回答三个问题

在看任何框架之前,先想清楚这三个问题:

问题 1:任务复杂度如何?

  • 单步工具调用(查一个 API)→ 任何轻量方案都够用
  • 多步推理循环(ReAct)→ 需要 Agent Loop 支持
  • 多 Agent 协作 → 需要专门的协作框架

问题 2:可控性要求多高?

  • 固定流程、合规要求高 → 倾向于 Workflow 化框架
  • 灵活决策、适应性强 → 倾向于 Agent 化框架
  • 既要可控又要灵活 → 状态机框架(LangGraph 类)

问题 3:团队背景是什么?

  • 非技术人员、快速验证 → 低代码平台
  • Python 工程师、原型开发 → 轻量框架
  • 大型工程团队、生产部署 → 全栈重框架或企业级方案

二、六层框架分类图谱

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
┌──────────────────────────────────────────────────────────────────┐
│ 第六层:企业/云原生层 │
│ Semantic Kernel · Amazon Bedrock Agents · Azure AI Foundry │
├──────────────────────────────────────────────────────────────────┤
│ 第五层:状态机/工作流层 │
│ LangGraph · Temporal + AI │
├──────────────────────────────────────────────────────────────────┤
│ 第四层:多 Agent 专向层 │
│ CrewAI · AutoGen · MetaGPT · CAMEL │
├──────────────────────────────────────────────────────────────────┤
│ 第三层:全栈重框架层 │
│ LangChain · LlamaIndex · Haystack │
├──────────────────────────────────────────────────────────────────┤
│ 第二层:轻量框架层 │
│ OpenAI Swarm · smolagents · Pydantic AI · Instructor │
├──────────────────────────────────────────────────────────────────┤
│ 第一层:低代码/无代码层 │
│ Coze · Dify · n8n · Flowise │
└──────────────────────────────────────────────────────────────────┘

三、各层核心特征

3.1 第一层:低代码/无代码平台

目标用户:产品经理、运营人员、非技术背景的 AI 探索者。
核心价值:拖拽式构建,无需写代码,快速上线。

平台 特点 适合场景
Coze 字节跳动出品,集成飞书/微信/Discord,插件生态丰富 快速搭建对话 Agent,接入各类平台
Dify 开源,私有化部署友好,工作流 + Agent 双模式 企业私有知识库问答,工作流自动化
n8n 自动化工作流为主,AI 节点是近两年新增 将 AI 嵌入已有的自动化流程
Flowise LangChain 的可视化版,开源 快速验证 LangChain 方案

局限:可定制性有限,复杂逻辑难以表达,生产环境的性能和可靠性依赖平台。

3.2 第二层:轻量框架

目标用户:Python 工程师、研究者、个人开发者。
核心价值:依赖少、核心可读、易于定制和学习,适合原型验证或深入理解 Agent 机制。

OpenAI Swarm
OpenAI 官方出品的极简多 Agent 框架,设计目标是教学和原型验证而非生产部署。核心概念只有两个:Agent(有名字、指令和工具的 LLM)和 Handoff(Agent 之间的控制权移交)。代码量极小,是理解多 Agent 协调机制的最佳入门材料。

smolagents(HuggingFace 出品)
最小化依赖的 Agent 框架,核心创新是 CodeAgent:Agent 用 Python 代码而非 JSON 表达 Action,天然支持工具组合和复杂逻辑,可读性更高,也更容易调试。适合对工具调用方式有定制需求的场景。

Pydantic AI
以类型安全为核心设计理念,用 Pydantic 的 Schema 约束 Agent 的输入输出和工具调用参数。适合注重代码质量和工程规范的团队,与现有 Python 类型注解体系无缝衔接。

Instructor
严格来说不是完整的 Agent 框架,而是专注于 Structured Output 的库。用 Pydantic 模型定义期望输出格式,自动处理重试直到 LLM 输出符合 Schema。可以搭配任何框架使用,是生产环境保证输出可解析的常用方案。

3.3 第三层:全栈重框架

目标用户:需要生产级功能的 Python 工程团队。
核心价值:覆盖 Agent 开发的完整链路,文档齐全,生态丰富。

LangChain(LLM 应用开发的早期奠基者)
几乎定义了 Agent 开发的基础抽象:Chain、Tool、Memory、Retriever、Prompt Template。生态最丰富,几乎所有 LLM 都有 LangChain 集成。
但随着功能膨胀,API 频繁变化、学习曲线陡峭的批评也不断出现。LangChain 后来推出 LangGraph 作为对复杂状态管理的答案。

LlamaIndex
与 LangChain 定位略有不同——LlamaIndex 以数据连接和 RAG 见长,强调”让 LLM 与私有数据对话”。其数据连接器(Data Connectors)和查询引擎(Query Engine)是业界参考标准。

Haystack
以生产环境 Pipeline 见长,强调可测试性和组件化。在文档搜索、问答系统等偏 RAG 的场景有大量生产案例。

3.4 第四层:多 Agent 专向框架

目标用户:需要多 Agent 协作的复杂系统工程师。
核心价值:提供角色定义、通信协议、协作模式的抽象。

框架 核心模式 特点
CrewAI 角色+任务分配 简单易用,定义角色和任务即可,是目前落地最多的多 Agent 框架
AutoGen 对话式多 Agent 微软出品,Agent 之间通过对话协作,灵活但难以预测
MetaGPT 软件公司 SOP 模拟研发团队(PM/架构师/程序员),适合代码生成类任务
CAMEL 角色扮演对话 学术背景,适合研究 Agent 间自主协作的行为

3.5 第五层:状态机/工作流框架

LangGraph(LangChain 团队出品)
将 Agent 执行过程建模为状态图(State Graph):节点是处理函数,边是状态转换条件。

核心优势:

  • 支持循环、分支、条件跳转
  • 人工介入节点(Human-in-the-loop)是一等公民
  • 状态持久化,支持长时间运行的任务
  • 比纯 LLM 驱动的 Agent 更可预测、可调试

当需要”可控的复杂流程”时,LangGraph 是目前最成熟的选择。Anthropic 的 Orchestrator-Subagents 模式用 LangGraph 实现效果最好。

3.6 第六层:企业/云原生层

目标用户:需要与企业现有基础设施深度集成的大型团队。

Semantic Kernel(微软出品)
支持 C# 和 Python 双语言,与 Azure、Office 365、Microsoft Graph 深度集成,适合微软技术栈的企业。

Amazon Bedrock Agents
AWS 的托管 Agent 服务,与 AWS 生态(S3、Lambda、RDS)深度集成,适合已经重度使用 AWS 的团队。

Azure AI Foundry
微软的企业 AI 平台,提供模型管理、Agent 编排、评估、监控的完整工具链。


四、选型决策逻辑

不需要写代码? → 低代码层(Coze/Dify/n8n)

需要写代码,但任务简单或个人项目? → 轻量层
 → 学习/理解多 Agent 机制:OpenAI Swarm
 → 代码即 Action 的灵活工具调用:smolagents
 → 类型安全优先的工程风格:Pydantic AI
 → 只需约束输出格式:Instructor

需要完整的生产级功能? → 全栈重框架
 → 以 RAG 为核心:LlamaIndex
 → 通用 LLM 应用开发:LangChain

核心需求是多 Agent 协作? → 多 Agent 专向层
 → 快速落地:CrewAI
 → 代码生成团队模拟:MetaGPT

需要复杂可控的流程控制? → LangGraph

深度集成企业现有 IT 基础设施? → 企业层(Semantic Kernel/Bedrock)


五、一个真正的选型建议

对于大多数项目,推荐的路径是:

  1. 先用低代码平台验证 idea(Dify/Coze),成本最低
  2. 验证可行后,用轻量框架重写核心(smolagents/Pydantic AI),控制复杂度
  3. 规模化时引入重框架或状态机框架(LangGraph),处理生产级挑战

每个阶段都有明确的升级信号:低代码平台碰到定制性瓶颈时升级;轻量框架碰到状态管理瓶颈时升级。

避免的常见错误:一开始就引入最重的框架(LangChain + 所有插件),在不了解工具的情况下被框架的复杂性淹没,最终花大量时间调框架而不是解决业务问题。


六、总结

框架不是目的,解决问题才是。掌握六层分类图谱后,面对任何新框架,先问三个问题:它在哪一层?它解决了那一层什么核心问题?我的项目需要那一层吗?

层次 代表框架 核心价值
低代码 Coze/Dify/n8n 无代码快速上线
轻量 OpenAI Swarm/smolagents/Pydantic AI 小而可读,原型/研究友好
全栈 LangChain/LlamaIndex 生产级功能全覆盖
多 Agent CrewAI/AutoGen/MetaGPT 角色协作编排
状态机 LangGraph 可控复杂流程
企业 Semantic Kernel/Bedrock 企业基础设施集成

下一篇:Agent 如何记住东西——四种记忆类型、RAG 的工作原理、Agentic RAG 与 GraphRAG,以及长上下文 vs RAG 的判断框架。