Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

第 12 章 · Agent:下一代「操作系统」之争

核心命题:Agent 是 AI 应用层的「第二个 ChatGPT 时刻」——但比第一个更长、更复杂、更值得长期下注。 数据锚点(2026 Q2):Cursor ARR 5 亿美金 / Cognition (Devin) 20 亿美金估值 / Manus 全球 50 万 stars / Glean ARR 1 亿美金。


12.1 Agent vs Copilot vs Workflow Automation

先厘清概念。「Agent」这个词在 2024-2026 年被严重滥用,必须区分 3 种产品形态:

类别特征典型
Copilot用户主导,AI 协助GitHub Copilot, Notion AI
Workflow Automation预定义流程,AI 执行步骤Zapier AI, Dify, n8n
Agent(真)AI 自主规划 + 工具调用 + 长程执行Devin, Manus, Cursor (Agent 模式)

只有第三类——自主规划 + 工具调用 + 长程执行——才是真正的 Agent。前两类是「伪 Agent」,技术深度和商业护城河都浅。

判断方法:

  • 任务能否「单 prompt 执行 30 分钟以上」?
  • 系统能否「自主决定下一步」(不需要人介入)?
  • 是否有「记忆 + 规划 + 工具调用 + 错误恢复」四件套?

三条都满足,是真 Agent。


12.2 主要玩家:5 个赛道方向

方向 1:通用 Agent

玩家估值状态
Cognition (Devin)20 亿美金通用编码 + 任务 Agent
Manus待公开(中国出圈)通用任务 Agent
AutoGPT 系多个开源早期探索

判断:通用 Agent 难度极高(任务空间无限),目前没有成熟产品。风险大但回报上限也大

方向 2:编码 Agent(最成熟)

玩家估值 / ARR特点
Cursor (Anysphere)100 亿美金 / 5 亿 ARRIDE + Agent 模式
Codeium / Windsurf~20 亿美金类似但落后
GitHub Copilot大厂早期但被 Cursor 抢份额
Replit~12 亿美金在线 IDE + Agent

判断:编码是 Agent 最早跑出 PMF 的赛道。Cursor 接近垄断,但 Codeium、Cognition 等仍在追赶。

方向 3:垂直行业 Agent

玩家行业特点
Harvey法律全美 top 律所采购
Glean企业搜索微软 365、Notion 集成
Hippocratic AI医疗患者沟通 Agent
Decagon客服替代传统 CS

判断:垂直行业 Agent 是最稳的赛道——单笔合同价值高(10-100 万美金 ARR),客户粘性强。

方向 4:销售 / 营销 Agent

玩家特点
Clay数据 + 自动化销售
Apollo AI销售 SDR Agent
Jasper营销内容 Agent

判断:销售 / 营销是 to B 早期最容易收钱的赛道——客户立刻看到 ROI(更多 leads / 更高 close rate)。

方向 5:消费级 Agent

玩家特点
Adept通用 web Agent
MultiOn浏览器 Agent
OpenAI OperatorOpenAI 自营
字节豆包大厂 to C

判断:消费级 Agent 最难——用户付费意愿低、技术成熟度低。还需要 12-24 个月


12.3 中国 Agent 崛起:Manus 全球出圈

2025 年 3 月,一家叫 Manus 的中国 Agent 公司在全球技术圈刷屏。

Manus 的特别

  • 通用任务 Agent(任务规划 + 工具调用 + 长程执行)
  • 演示视频在 X 上播放过 1 亿次
  • GitHub 一周涨 30,000 stars
  • 创始人是名不见经传的小团队

为什么 Manus 让人惊讶?

因为它证明了几件事:

  1. 中国小团队能做出与硅谷同水平的 Agent 产品——不需要大厂资源;
  2. 演示驱动的传播速度——一个好 demo 比 100 篇论文有效;
  3. 全球用户的兴趣是真的——不只是中国用户。

张倩对 Agent 赛道的判断

Agent 是个很 amazing 的大赛道——目前被市场过度谨慎对待

大家觉得『通用 Agent 还不成熟』『收钱模式不清晰』——但这正是窗口期。等通用 Agent 跑通时,估值已经飞涨。」[1]


12.4 Agent 的商业模式:4 种收钱方式

收钱方式 1:按 Token(API-style)

  • 优点:成本和收入直接挂钩
  • 缺点:客户难预算
  • 适合:开发者工具、API 平台
  • 典型:Anthropic API, OpenAI API

收钱方式 2:按结果(Outcome-based)

  • 优点:客户 ROI 清晰
  • 缺点:质量评估难,纠纷多
  • 适合:销售 Agent(按 close rate 分成)、招聘 Agent(按 hire 分成)
  • 典型:部分 Sales Agent、Recruiter Agent

收钱方式 3:按席位(Seat-based)

  • 优点:可预测、SaaS 化
  • 缺点:粘性中等
  • 适合:编码 Agent、企业 Agent
  • 典型:Cursor ($20/seat/month), GitHub Copilot

收钱方式 4:按场景(Use-case bundled)

  • 优点:客户感知价值清晰
  • 缺点:定价复杂
  • 适合:垂直行业 Agent(法律、医疗)
  • 典型:Harvey, Hippocratic AI

12.5 关键技术节点

节点 1:长程任务能力

Agent 能处理多长任务?目前的 SOTA:

  • Cursor:编码任务可以 30 分钟以上
  • Devin:单任务可以数小时
  • Manus:演示中 24 小时连续任务

下一个里程碑:1 周连续任务 = AGI 边界

节点 2:工具调用稳定性

Agent 调用 100 次工具,多少次失败?目前:

  • 单工具调用成功率:90%+
  • 5 步链式调用成功率:60-70%
  • 20 步链式调用成功率:<30%

下一个里程碑:20 步成功率 > 80% = 真正可商用通用 Agent

节点 3:记忆系统

Agent 是否有「长期记忆」?

  • 大多数还没有真正的长期记忆(每次对话独立)
  • 部分有「项目记忆」(如 Cursor 记住代码库)
  • 真正的「人格记忆」还在研究

下一个里程碑:跨会话连续记忆 + 个性化适配

节点 4:多 Agent 协同

多个 Agent 协作完成复杂任务:

  • 最早的 AutoGPT 已经做过尝试
  • CrewAI、AutoGen 是开源方案
  • 真正商用的还少

下一个里程碑:Agent 公司」——5-20 个 AI Agent 协同完成一个任务


12.6 投资判断:垂直 vs 通用

短期(12-18 个月):押垂直

理由:

  1. 通用 Agent 技术不成熟(长程任务、工具调用、记忆都未达标);
  2. 垂直 Agent 已有清晰客户和收钱模式;
  3. 估值锚点低(5-10 亿美金 vs 通用 Agent 50-100 亿);
  4. 退出路径清晰(被巨头收购或独立 IPO)。

最值得押的垂直:法律、医疗、销售、客服、招聘。

中期(2-5 年):通用会跑通

理由:

  1. 模型能力会持续提升(每 6 周一代);
  2. 工具调用稳定性会到 80%+;
  3. 记忆系统会成熟;
  4. 届时通用 Agent 会变成「Agent OS」——下一代操作系统

最值得押的通用 Agent:Cognition、Manus、目前还看不到的黑马。

长期(5+ 年):Agent vs LLM 边界模糊

理由:

  1. 模型 + Agent + 工具会融合
  2. 用户不再区分「LLM」和「Agent
  3. 整个 AI 应用层都会 Agent 化

12.7 9 项 Agent 项目尽调维度

  1. 任务空间:解决什么任务?是否清晰可测量?
  2. 长程能力:单任务能持续多久?
  3. 工具调用:调用了多少种工具?成功率?
  4. 记忆系统:是否有跨会话记忆?
  5. 客户与收钱:to B / to C?按什么收钱?ARR 多少?
  6. 数据飞轮:用户使用是否提升模型能力?
  7. 团队技术深度:核心团队是否有 transformer / RL 真实工作?
  8. 基础设施:自建 infra 还是租用?成本结构?
  9. 护城河:除了模型本身,还有什么差异化?

12.8 反例与陷阱

陷阱 1:「通用即万能

很多 Agent 项目说「我们做通用 Agent」——但实际:

  • 没有清晰的「第一个 100 万用户」场景;
  • 演示 demo 漂亮但实际用户留存极低;
  • 团队烧钱速度极快但无收入。

正确判断:先做某个具体场景的 PMF,再扩展通用

陷阱 2:「包装 Workflow 当 Agent

很多「AI Agent」实际上是预定义 workflow + LLM 调用。这种产品:

  • 技术深度浅
  • 容易被竞争对手复制
  • 难形成长期护城河

判断方法:让产品执行一个没有预定义 workflow 的任务——能否完成?

陷阱 3:「估值套利

Cursor 100 亿,那我投个『Cursor 中国版』,1 年内估值翻 10 倍」——这是估值套利思维。

但 Cursor 的估值来自真实 ARR 5 亿美金。中国「Cursor 中国版」如果没有真实 ARR,估值难持续。


12.9 落地清单

给 VC 投资人

  1. 重仓垂直 Agent:法律、医疗、销售、客服——选 1-2 个深度跟踪;
  2. 谨慎通用 Agent:等技术里程碑达标再下重注;
  3. 跟踪开源 Agent 框架:CrewAI、AutoGen、LangGraph、Dify——这些工具的 trending 是 alpha 信号源。

给 AI 创业者

  1. 不要做「通用 Agent:除非你有 10 亿美金资金 + 顶级 AI 研究团队;
  2. 选一个具体场景:法律合同审核、销售 SDR、医疗病史整理;
  3. 用 Agent 框架快速 MVP:CrewAI / LangGraph / Dify 都可以;
  4. 3 个月内拿到第一个付费客户:to B Agent 早期付费验证比 DAU 重要 100 倍。

给 LP

  1. 接受 Agent 是长期赛道:12-18 个月内不一定见 PMF;
  2. 看 GP 的 Agent 配置:portfolio 里有没有 1-2 个垂直 Agent + 1 个通用 Agent option?

12.10 Agent 的「反共识」机会清单

虽然 Agent 是热门赛道,但仍有反共识机会:

反共识 1:「慢 Agent」(任务时长 1 周 +)

主流 Agent 追求「快速回应」(30 秒内出结果)。但真正高价值任务往往需要:

  • 持续 1 周的市场调研
  • 持续 1 个月的销售跟进
  • 持续 3 个月的项目管理

如果能做出「慢 Agent」(task duration > 1 周),单次任务价值可达 $1000-10000——比快 Agent 单次 $1-10 高 1000 倍。

候选玩家:暂未出现明确赢家。

反共识 2:「多 Agent 公司

把 5-20 个 AI Agent 组合成「虚拟公司」——执行复杂业务流程。

候选玩家:CrewAI、AutoGen、LangGraph(开源框架),暂无商业化领头羊。

反共识 3:「Agent OS

下一代「操作系统」——所有应用都是 Agent,而不是 GUI App。

候选玩家:Cognition (Devin)、Manus、OpenAI Operator——但都还远未成熟。

反共识 4:垂直 Agent + 硬件

把 Agent 部署到物理设备:

  • 销售 Agent 嵌入门店摄像头 + POS
  • 客服 Agent 嵌入电话呼叫中心硬件
  • 教育 Agent 嵌入交互式硬件

候选玩家:基本是空白——这是天际「软硬一体」逻辑可以延伸的方向。


12.11 中国 Agent 创业者的 3 个独特机会

机会 1:制造业 Agent

中国是全球制造业第一——AI Agent 嵌入工业流程是巨大机会:

  • 质检 Agent(替代人工质检)
  • 排产 Agent(动态优化生产线)
  • 物流 Agent(仓储 + 配送优化)
  • 设备运维 Agent(预测性维护)

中国制造业 IT 预算约 1 万亿人民币,5% 转向 AI Agent 即 500 亿人民币市场

机会 2:跨境电商 Agent

中国跨境电商 GMV 超过 5 万亿——AI Agent 在选品 / 营销 / 客服 / 运营各环节都有机会:

  • 选品 Agent(亚马逊 / TikTok 数据分析)
  • 营销 Agent(多语言广告投放)
  • 客服 Agent(24x7 多语言)
  • 物流 Agent(跨境通关)

机会 3:政企服务 Agent

中国央国企 + 政府 IT 预算约 5000 亿——AI Agent 切入:

  • 公文 Agent(自动起草、审核)
  • 项目 Agent(招投标、合同管理)
  • 智能客服 Agent(市民服务)
  • 监管 Agent(数据合规审查)

注意:政企赛道周期长、回款慢、监管严——只适合特定团队。


12.12 Agent 创业的「18 个月生死线

基于 30 多个 Agent 创业案例的复盘,我提炼出**「18 个月生死线」**:

月份关键里程碑失败信号
0-3Demo 出来没有 Demo = 立即 pass
3-6第一个付费客户0 付费 = 警告
6-95-10 个付费客户 + ARR 30 万美金< 3 客户 = 红旗
9-12ARR 100 万美金< 50 万 = 准备 quit
12-18ARR 300 万美金 + A 轮启动增长停滞 = quit

任何一个 milestone 超期 3 个月以上且没有强解释,质疑团队执行力。


12.13 Agent 估值锚点(2026 Q2 实战参考)

不同阶段的 Agent 公司合理估值(笔者实战经验,仅供参考):

阶段ARR合理估值范围
Pre-Seed0$5-15M
Seed$0-300K$15-40M
Pre-A$300K-1M$40-80M
A$1M-5M$80-200M
B$5M-20M$200M-1B
C$20M-100M$1B-5B
D+$100M+$5B+

注意

  • 这些是「真应用」的合理估值
  • 套壳」应用的估值打 5-7 折
  • 通用 Agent candidate」(如 Cognition)估值溢价 2-3x
  • 创始人含金量(如杨植麟级别)估值溢价 1.5-2x

本章小结

Agent 是 AI 应用层的下一代操作系统——但成熟需要时间。

Agent vs Copilot vs Workflow 三类产品必须区分。只有「自主规划 + 工具调用 + 长程执行 + 错误恢复」四件套才是真 Agent。

5 个赛道方向:通用、编码(最成熟,Cursor 100 亿)、垂直行业(最稳,Harvey / Glean)、销售营销、消费级(最难)。

中国 Agent 崛起:Manus 全球出圈证明中国小团队也能做世界级 Agent。

4 种收钱方式:token、结果、席位、场景——选择决定单价和粘性。

4 个技术节点:长程任务、工具调用稳定性、记忆系统、多 Agent 协同。

投资判断:短期押垂直,中期通用跑通,长期 Agent vs LLM 融合。

9 项尽调清单 + 3 个陷阱(通用即万能、Workflow 包装、估值套利)。


引用