第 12 章 · Agent:下一代「操作系统」之争
核心命题:Agent 是 AI 应用层的「第二个 ChatGPT 时刻」——但比第一个更长、更复杂、更值得长期下注。 数据锚点(2026 Q2):Cursor ARR 5 亿美金 / Cognition (Devin) 20 亿美金估值 / Manus 全球 50 万 stars / Glean ARR 1 亿美金。
12.1 Agent vs Copilot vs Workflow Automation
先厘清概念。「Agent」这个词在 2024-2026 年被严重滥用,必须区分 3 种产品形态:
| 类别 | 特征 | 典型 |
|---|---|---|
| Copilot | 用户主导,AI 协助 | GitHub Copilot, Notion AI |
| Workflow Automation | 预定义流程,AI 执行步骤 | Zapier AI, Dify, n8n |
| Agent(真) | AI 自主规划 + 工具调用 + 长程执行 | Devin, Manus, Cursor (Agent 模式) |
只有第三类——自主规划 + 工具调用 + 长程执行——才是真正的 Agent。前两类是「伪 Agent」,技术深度和商业护城河都浅。
判断方法:
- 任务能否「单 prompt 执行 30 分钟以上」?
- 系统能否「自主决定下一步」(不需要人介入)?
- 是否有「记忆 + 规划 + 工具调用 + 错误恢复」四件套?
三条都满足,是真 Agent。
12.2 主要玩家:5 个赛道方向
方向 1:通用 Agent
| 玩家 | 估值 | 状态 |
|---|---|---|
| Cognition (Devin) | 20 亿美金 | 通用编码 + 任务 Agent |
| Manus | 待公开(中国出圈) | 通用任务 Agent |
| AutoGPT 系 | 多个开源 | 早期探索 |
判断:通用 Agent 难度极高(任务空间无限),目前没有成熟产品。风险大但回报上限也大。
方向 2:编码 Agent(最成熟)
| 玩家 | 估值 / ARR | 特点 |
|---|---|---|
| Cursor (Anysphere) | 100 亿美金 / 5 亿 ARR | IDE + Agent 模式 |
| Codeium / Windsurf | ~20 亿美金 | 类似但落后 |
| GitHub Copilot | 大厂 | 早期但被 Cursor 抢份额 |
| Replit | ~12 亿美金 | 在线 IDE + Agent |
判断:编码是 Agent 最早跑出 PMF 的赛道。Cursor 接近垄断,但 Codeium、Cognition 等仍在追赶。
方向 3:垂直行业 Agent
| 玩家 | 行业 | 特点 |
|---|---|---|
| Harvey | 法律 | 全美 top 律所采购 |
| Glean | 企业搜索 | 微软 365、Notion 集成 |
| Hippocratic AI | 医疗 | 患者沟通 Agent |
| Decagon | 客服 | 替代传统 CS |
判断:垂直行业 Agent 是最稳的赛道——单笔合同价值高(10-100 万美金 ARR),客户粘性强。
方向 4:销售 / 营销 Agent
| 玩家 | 特点 |
|---|---|
| Clay | 数据 + 自动化销售 |
| Apollo AI | 销售 SDR Agent |
| Jasper | 营销内容 Agent |
判断:销售 / 营销是 to B 早期最容易收钱的赛道——客户立刻看到 ROI(更多 leads / 更高 close rate)。
方向 5:消费级 Agent
| 玩家 | 特点 |
|---|---|
| Adept | 通用 web Agent |
| MultiOn | 浏览器 Agent |
| OpenAI Operator | OpenAI 自营 |
| 字节豆包 | 大厂 to C |
判断:消费级 Agent 最难——用户付费意愿低、技术成熟度低。还需要 12-24 个月。
12.3 中国 Agent 崛起:Manus 全球出圈
2025 年 3 月,一家叫 Manus 的中国 Agent 公司在全球技术圈刷屏。
Manus 的特别:
- 通用任务 Agent(任务规划 + 工具调用 + 长程执行)
- 演示视频在 X 上播放过 1 亿次
- GitHub 一周涨 30,000 stars
- 创始人是名不见经传的小团队
为什么 Manus 让人惊讶?
因为它证明了几件事:
- 中国小团队能做出与硅谷同水平的 Agent 产品——不需要大厂资源;
- 演示驱动的传播速度——一个好 demo 比 100 篇论文有效;
- 全球用户的兴趣是真的——不只是中国用户。
张倩对 Agent 赛道的判断:
「Agent 是个很 amazing 的大赛道——目前被市场过度谨慎对待。
大家觉得『通用 Agent 还不成熟』『收钱模式不清晰』——但这正是窗口期。等通用 Agent 跑通时,估值已经飞涨。」[1]
12.4 Agent 的商业模式:4 种收钱方式
收钱方式 1:按 Token(API-style)
- 优点:成本和收入直接挂钩
- 缺点:客户难预算
- 适合:开发者工具、API 平台
- 典型:Anthropic API, OpenAI API
收钱方式 2:按结果(Outcome-based)
- 优点:客户 ROI 清晰
- 缺点:质量评估难,纠纷多
- 适合:销售 Agent(按 close rate 分成)、招聘 Agent(按 hire 分成)
- 典型:部分 Sales Agent、Recruiter Agent
收钱方式 3:按席位(Seat-based)
- 优点:可预测、SaaS 化
- 缺点:粘性中等
- 适合:编码 Agent、企业 Agent
- 典型:Cursor ($20/seat/month), GitHub Copilot
收钱方式 4:按场景(Use-case bundled)
- 优点:客户感知价值清晰
- 缺点:定价复杂
- 适合:垂直行业 Agent(法律、医疗)
- 典型:Harvey, Hippocratic AI
12.5 关键技术节点
节点 1:长程任务能力
Agent 能处理多长任务?目前的 SOTA:
- Cursor:编码任务可以 30 分钟以上
- Devin:单任务可以数小时
- Manus:演示中 24 小时连续任务
下一个里程碑:1 周连续任务 = AGI 边界。
节点 2:工具调用稳定性
Agent 调用 100 次工具,多少次失败?目前:
- 单工具调用成功率:90%+
- 5 步链式调用成功率:60-70%
- 20 步链式调用成功率:<30%
下一个里程碑:20 步成功率 > 80% = 真正可商用通用 Agent。
节点 3:记忆系统
Agent 是否有「长期记忆」?
- 大多数还没有真正的长期记忆(每次对话独立)
- 部分有「项目记忆」(如 Cursor 记住代码库)
- 真正的「人格记忆」还在研究
下一个里程碑:跨会话连续记忆 + 个性化适配。
节点 4:多 Agent 协同
多个 Agent 协作完成复杂任务:
- 最早的 AutoGPT 已经做过尝试
- CrewAI、AutoGen 是开源方案
- 真正商用的还少
下一个里程碑:「Agent 公司」——5-20 个 AI Agent 协同完成一个任务。
12.6 投资判断:垂直 vs 通用
短期(12-18 个月):押垂直
理由:
- 通用 Agent 技术不成熟(长程任务、工具调用、记忆都未达标);
- 垂直 Agent 已有清晰客户和收钱模式;
- 估值锚点低(5-10 亿美金 vs 通用 Agent 50-100 亿);
- 退出路径清晰(被巨头收购或独立 IPO)。
最值得押的垂直:法律、医疗、销售、客服、招聘。
中期(2-5 年):通用会跑通
理由:
- 模型能力会持续提升(每 6 周一代);
- 工具调用稳定性会到 80%+;
- 记忆系统会成熟;
- 届时通用 Agent 会变成「Agent OS」——下一代操作系统。
最值得押的通用 Agent:Cognition、Manus、目前还看不到的黑马。
长期(5+ 年):Agent vs LLM 边界模糊
理由:
- 模型 + Agent + 工具会融合
- 用户不再区分「LLM」和「Agent」
- 整个 AI 应用层都会 Agent 化
12.7 9 项 Agent 项目尽调维度
- 任务空间:解决什么任务?是否清晰可测量?
- 长程能力:单任务能持续多久?
- 工具调用:调用了多少种工具?成功率?
- 记忆系统:是否有跨会话记忆?
- 客户与收钱:to B / to C?按什么收钱?ARR 多少?
- 数据飞轮:用户使用是否提升模型能力?
- 团队技术深度:核心团队是否有 transformer / RL 真实工作?
- 基础设施:自建 infra 还是租用?成本结构?
- 护城河:除了模型本身,还有什么差异化?
12.8 反例与陷阱
陷阱 1:「通用即万能」
很多 Agent 项目说「我们做通用 Agent」——但实际:
- 没有清晰的「第一个 100 万用户」场景;
- 演示 demo 漂亮但实际用户留存极低;
- 团队烧钱速度极快但无收入。
正确判断:先做某个具体场景的 PMF,再扩展通用。
陷阱 2:「包装 Workflow 当 Agent」
很多「AI Agent」实际上是预定义 workflow + LLM 调用。这种产品:
- 技术深度浅
- 容易被竞争对手复制
- 难形成长期护城河
判断方法:让产品执行一个没有预定义 workflow 的任务——能否完成?
陷阱 3:「估值套利」
「Cursor 100 亿,那我投个『Cursor 中国版』,1 年内估值翻 10 倍」——这是估值套利思维。
但 Cursor 的估值来自真实 ARR 5 亿美金。中国「Cursor 中国版」如果没有真实 ARR,估值难持续。
12.9 落地清单
给 VC 投资人
- 重仓垂直 Agent:法律、医疗、销售、客服——选 1-2 个深度跟踪;
- 谨慎通用 Agent:等技术里程碑达标再下重注;
- 跟踪开源 Agent 框架:CrewAI、AutoGen、LangGraph、Dify——这些工具的 trending 是 alpha 信号源。
给 AI 创业者
- 不要做「通用 Agent」:除非你有 10 亿美金资金 + 顶级 AI 研究团队;
- 选一个具体场景:法律合同审核、销售 SDR、医疗病史整理;
- 用 Agent 框架快速 MVP:CrewAI / LangGraph / Dify 都可以;
- 3 个月内拿到第一个付费客户:to B Agent 早期付费验证比 DAU 重要 100 倍。
给 LP
- 接受 Agent 是长期赛道:12-18 个月内不一定见 PMF;
- 看 GP 的 Agent 配置:portfolio 里有没有 1-2 个垂直 Agent + 1 个通用 Agent option?
12.10 Agent 的「反共识」机会清单
虽然 Agent 是热门赛道,但仍有反共识机会:
反共识 1:「慢 Agent」(任务时长 1 周 +)
主流 Agent 追求「快速回应」(30 秒内出结果)。但真正高价值任务往往需要:
- 持续 1 周的市场调研
- 持续 1 个月的销售跟进
- 持续 3 个月的项目管理
如果能做出「慢 Agent」(task duration > 1 周),单次任务价值可达 $1000-10000——比快 Agent 单次 $1-10 高 1000 倍。
候选玩家:暂未出现明确赢家。
反共识 2:「多 Agent 公司」
把 5-20 个 AI Agent 组合成「虚拟公司」——执行复杂业务流程。
候选玩家:CrewAI、AutoGen、LangGraph(开源框架),暂无商业化领头羊。
反共识 3:「Agent OS」
下一代「操作系统」——所有应用都是 Agent,而不是 GUI App。
候选玩家:Cognition (Devin)、Manus、OpenAI Operator——但都还远未成熟。
反共识 4:垂直 Agent + 硬件
把 Agent 部署到物理设备:
- 销售 Agent 嵌入门店摄像头 + POS
- 客服 Agent 嵌入电话呼叫中心硬件
- 教育 Agent 嵌入交互式硬件
候选玩家:基本是空白——这是天际「软硬一体」逻辑可以延伸的方向。
12.11 中国 Agent 创业者的 3 个独特机会
机会 1:制造业 Agent
中国是全球制造业第一——AI Agent 嵌入工业流程是巨大机会:
- 质检 Agent(替代人工质检)
- 排产 Agent(动态优化生产线)
- 物流 Agent(仓储 + 配送优化)
- 设备运维 Agent(预测性维护)
中国制造业 IT 预算约 1 万亿人民币,5% 转向 AI Agent 即 500 亿人民币市场。
机会 2:跨境电商 Agent
中国跨境电商 GMV 超过 5 万亿——AI Agent 在选品 / 营销 / 客服 / 运营各环节都有机会:
- 选品 Agent(亚马逊 / TikTok 数据分析)
- 营销 Agent(多语言广告投放)
- 客服 Agent(24x7 多语言)
- 物流 Agent(跨境通关)
机会 3:政企服务 Agent
中国央国企 + 政府 IT 预算约 5000 亿——AI Agent 切入:
- 公文 Agent(自动起草、审核)
- 项目 Agent(招投标、合同管理)
- 智能客服 Agent(市民服务)
- 监管 Agent(数据合规审查)
但注意:政企赛道周期长、回款慢、监管严——只适合特定团队。
12.12 Agent 创业的「18 个月生死线」
基于 30 多个 Agent 创业案例的复盘,我提炼出**「18 个月生死线」**:
| 月份 | 关键里程碑 | 失败信号 |
|---|---|---|
| 0-3 | Demo 出来 | 没有 Demo = 立即 pass |
| 3-6 | 第一个付费客户 | 0 付费 = 警告 |
| 6-9 | 5-10 个付费客户 + ARR 30 万美金 | < 3 客户 = 红旗 |
| 9-12 | ARR 100 万美金 | < 50 万 = 准备 quit |
| 12-18 | ARR 300 万美金 + A 轮启动 | 增长停滞 = quit |
任何一个 milestone 超期 3 个月以上且没有强解释,质疑团队执行力。
12.13 Agent 估值锚点(2026 Q2 实战参考)
不同阶段的 Agent 公司合理估值(笔者实战经验,仅供参考):
| 阶段 | ARR | 合理估值范围 |
|---|---|---|
| Pre-Seed | 0 | $5-15M |
| Seed | $0-300K | $15-40M |
| Pre-A | $300K-1M | $40-80M |
| A | $1M-5M | $80-200M |
| B | $5M-20M | $200M-1B |
| C | $20M-100M | $1B-5B |
| D+ | $100M+ | $5B+ |
注意:
- 这些是「真应用」的合理估值
- 「套壳」应用的估值打 5-7 折
- 「通用 Agent candidate」(如 Cognition)估值溢价 2-3x
- 创始人含金量(如杨植麟级别)估值溢价 1.5-2x
本章小结
Agent 是 AI 应用层的下一代操作系统——但成熟需要时间。
Agent vs Copilot vs Workflow 三类产品必须区分。只有「自主规划 + 工具调用 + 长程执行 + 错误恢复」四件套才是真 Agent。
5 个赛道方向:通用、编码(最成熟,Cursor 100 亿)、垂直行业(最稳,Harvey / Glean)、销售营销、消费级(最难)。
中国 Agent 崛起:Manus 全球出圈证明中国小团队也能做世界级 Agent。
4 种收钱方式:token、结果、席位、场景——选择决定单价和粘性。
4 个技术节点:长程任务、工具调用稳定性、记忆系统、多 Agent 协同。
投资判断:短期押垂直,中期通用跑通,长期 Agent vs LLM 融合。
9 项尽调清单 + 3 个陷阱(通用即万能、Workflow 包装、估值套利)。
引用
- [1] 新浪财经 (2025-09-07):雷军和张一鸣背后的女人,正在寻找下一个字节
- [2] 各 Agent 公司公开融资数据(Cursor / Cognition / Glean / Harvey / Manus)
- [3] CrewAI / AutoGen / LangGraph 开源项目 README