第 12 章 · Agent：下一代「操作系统」之争

核心命题：Agent 是 AI 应用层的「第二个 ChatGPT 时刻」——但比第一个更长、更复杂、更值得长期下注。 数据锚点（2026 Q2）：Cursor ARR 5 亿美金 / Cognition (Devin) 20 亿美金估值 / Manus 全球 50 万 stars / Glean ARR 1 亿美金。

12.1 Agent vs Copilot vs Workflow Automation

先厘清概念。「Agent」这个词在 2024-2026 年被严重滥用，必须区分 3 种产品形态：

类别	特征	典型
Copilot	用户主导，AI 协助	GitHub Copilot, Notion AI
Workflow Automation	预定义流程，AI 执行步骤	Zapier AI, Dify, n8n
Agent（真）	AI 自主规划 + 工具调用 + 长程执行	Devin, Manus, Cursor (Agent 模式)

只有第三类——自主规划 + 工具调用 + 长程执行——才是真正的 Agent。前两类是「伪 Agent」，技术深度和商业护城河都浅。

判断方法：

任务能否「单 prompt 执行 30 分钟以上」？
系统能否「自主决定下一步」（不需要人介入）？
是否有「记忆 + 规划 + 工具调用 + 错误恢复」四件套？

三条都满足，是真 Agent。

12.2 主要玩家：5 个赛道方向

方向 1：通用 Agent

玩家	估值	状态
Cognition (Devin)	20 亿美金	通用编码 + 任务 Agent
Manus	待公开（中国出圈）	通用任务 Agent
AutoGPT 系	多个开源	早期探索

判断：通用 Agent 难度极高（任务空间无限），目前没有成熟产品。风险大但回报上限也大。

方向 2：编码 Agent（最成熟）

玩家	估值 / ARR	特点
Cursor (Anysphere)	100 亿美金 / 5 亿 ARR	IDE + Agent 模式
Codeium / Windsurf	~20 亿美金	类似但落后
GitHub Copilot	大厂	早期但被 Cursor 抢份额
Replit	~12 亿美金	在线 IDE + Agent

判断：编码是 Agent 最早跑出 PMF 的赛道。Cursor 接近垄断，但 Codeium、Cognition 等仍在追赶。

方向 3：垂直行业 Agent

玩家	行业	特点
Harvey	法律	全美 top 律所采购
Glean	企业搜索	微软 365、Notion 集成
Hippocratic AI	医疗	患者沟通 Agent
Decagon	客服	替代传统 CS

判断：垂直行业 Agent 是最稳的赛道——单笔合同价值高（10-100 万美金 ARR），客户粘性强。

方向 4：销售 / 营销 Agent

玩家	特点
Clay	数据 + 自动化销售
Apollo AI	销售 SDR Agent
Jasper	营销内容 Agent

判断：销售 / 营销是 to B 早期最容易收钱的赛道——客户立刻看到 ROI（更多 leads / 更高 close rate）。

方向 5：消费级 Agent

玩家	特点
Adept	通用 web Agent
MultiOn	浏览器 Agent
OpenAI Operator	OpenAI 自营
字节豆包	大厂 to C

判断：消费级 Agent 最难——用户付费意愿低、技术成熟度低。还需要 12-24 个月。

12.3 中国 Agent 崛起：Manus 全球出圈

2025 年 3 月，一家叫 Manus 的中国 Agent 公司在全球技术圈刷屏。

Manus 的特别：

通用任务 Agent（任务规划 + 工具调用 + 长程执行）
演示视频在 X 上播放过 1 亿次
GitHub 一周涨 30,000 stars
创始人是名不见经传的小团队

为什么 Manus 让人惊讶？

因为它证明了几件事：

中国小团队能做出与硅谷同水平的 Agent 产品——不需要大厂资源；
演示驱动的传播速度——一个好 demo 比 100 篇论文有效；
全球用户的兴趣是真的——不只是中国用户。

张倩对 Agent 赛道的判断：

「Agent 是个很 amazing 的大赛道——目前被市场过度谨慎对待。

大家觉得『通用 Agent 还不成熟』『收钱模式不清晰』——但这正是窗口期。等通用 Agent 跑通时，估值已经飞涨。」[1]

12.4 Agent 的商业模式：4 种收钱方式

收钱方式 1：按 Token（API-style）

优点：成本和收入直接挂钩
缺点：客户难预算
适合：开发者工具、API 平台
典型：Anthropic API, OpenAI API

收钱方式 2：按结果（Outcome-based）

优点：客户 ROI 清晰
缺点：质量评估难，纠纷多
适合：销售 Agent（按 close rate 分成）、招聘 Agent（按 hire 分成）
典型：部分 Sales Agent、Recruiter Agent

收钱方式 3：按席位（Seat-based）

优点：可预测、SaaS 化
缺点：粘性中等
适合：编码 Agent、企业 Agent
典型：Cursor ($20/seat/month), GitHub Copilot

收钱方式 4：按场景（Use-case bundled）

优点：客户感知价值清晰
缺点：定价复杂
适合：垂直行业 Agent（法律、医疗）
典型：Harvey, Hippocratic AI

12.5 关键技术节点

节点 1：长程任务能力

Agent 能处理多长任务？目前的 SOTA：

Cursor：编码任务可以 30 分钟以上
Devin：单任务可以数小时
Manus：演示中 24 小时连续任务

下一个里程碑：1 周连续任务 = AGI 边界。

节点 2：工具调用稳定性

Agent 调用 100 次工具，多少次失败？目前：

单工具调用成功率：90%+
5 步链式调用成功率：60-70%
20 步链式调用成功率：<30%

下一个里程碑：20 步成功率 > 80% = 真正可商用通用 Agent。

节点 3：记忆系统

Agent 是否有「长期记忆」？

大多数还没有真正的长期记忆（每次对话独立）
部分有「项目记忆」（如 Cursor 记住代码库）
真正的「人格记忆」还在研究

下一个里程碑：跨会话连续记忆 + 个性化适配。

节点 4：多 Agent 协同

多个 Agent 协作完成复杂任务：

最早的 AutoGPT 已经做过尝试
CrewAI、AutoGen 是开源方案
真正商用的还少

下一个里程碑：「Agent 公司」——5-20 个 AI Agent 协同完成一个任务。

12.6 投资判断：垂直 vs 通用

短期（12-18 个月）：押垂直

理由：

通用 Agent 技术不成熟（长程任务、工具调用、记忆都未达标）；
垂直 Agent 已有清晰客户和收钱模式；
估值锚点低（5-10 亿美金 vs 通用 Agent 50-100 亿）；
退出路径清晰（被巨头收购或独立 IPO）。

最值得押的垂直：法律、医疗、销售、客服、招聘。

中期（2-5 年）：通用会跑通

理由：

模型能力会持续提升（每 6 周一代）；
工具调用稳定性会到 80%+；
记忆系统会成熟；
届时通用 Agent 会变成「Agent OS」——下一代操作系统。

最值得押的通用 Agent：Cognition、Manus、目前还看不到的黑马。

长期（5+ 年）：Agent vs LLM 边界模糊

理由：

模型 + Agent + 工具会融合
用户不再区分「LLM」和「Agent」
整个 AI 应用层都会 Agent 化

12.7 9 项 Agent 项目尽调维度

任务空间：解决什么任务？是否清晰可测量？
长程能力：单任务能持续多久？
工具调用：调用了多少种工具？成功率？
记忆系统：是否有跨会话记忆？
客户与收钱：to B / to C？按什么收钱？ARR 多少？
数据飞轮：用户使用是否提升模型能力？
团队技术深度：核心团队是否有 transformer / RL 真实工作？
基础设施：自建 infra 还是租用？成本结构？
护城河：除了模型本身，还有什么差异化？

12.8 反例与陷阱

陷阱 1：「通用即万能」

很多 Agent 项目说「我们做通用 Agent」——但实际：

没有清晰的「第一个 100 万用户」场景；
演示 demo 漂亮但实际用户留存极低；
团队烧钱速度极快但无收入。

正确判断：先做某个具体场景的 PMF，再扩展通用。

陷阱 2：「包装 Workflow 当 Agent」

很多「AI Agent」实际上是预定义 workflow + LLM 调用。这种产品：

技术深度浅
容易被竞争对手复制
难形成长期护城河

判断方法：让产品执行一个没有预定义 workflow 的任务——能否完成？

陷阱 3：「估值套利」

「Cursor 100 亿，那我投个『Cursor 中国版』，1 年内估值翻 10 倍」——这是估值套利思维。

但 Cursor 的估值来自真实 ARR 5 亿美金。中国「Cursor 中国版」如果没有真实 ARR，估值难持续。

12.9 落地清单

给 VC 投资人

重仓垂直 Agent：法律、医疗、销售、客服——选 1-2 个深度跟踪；
谨慎通用 Agent：等技术里程碑达标再下重注；
跟踪开源 Agent 框架：CrewAI、AutoGen、LangGraph、Dify——这些工具的 trending 是 alpha 信号源。

给 AI 创业者

不要做「通用 Agent」：除非你有 10 亿美金资金 + 顶级 AI 研究团队；
选一个具体场景：法律合同审核、销售 SDR、医疗病史整理；
用 Agent 框架快速 MVP：CrewAI / LangGraph / Dify 都可以；
3 个月内拿到第一个付费客户：to B Agent 早期付费验证比 DAU 重要 100 倍。

给 LP

接受 Agent 是长期赛道：12-18 个月内不一定见 PMF；
看 GP 的 Agent 配置：portfolio 里有没有 1-2 个垂直 Agent + 1 个通用 Agent option？

12.10 Agent 的「反共识」机会清单

虽然 Agent 是热门赛道，但仍有反共识机会：

反共识 1：「慢 Agent」（任务时长 1 周 +）

主流 Agent 追求「快速回应」（30 秒内出结果）。但真正高价值任务往往需要：

持续 1 周的市场调研
持续 1 个月的销售跟进
持续 3 个月的项目管理

如果能做出「慢 Agent」（task duration > 1 周），单次任务价值可达 $1000-10000——比快 Agent 单次 $1-10 高 1000 倍。

候选玩家：暂未出现明确赢家。

反共识 2：「多 Agent 公司」

把 5-20 个 AI Agent 组合成「虚拟公司」——执行复杂业务流程。

候选玩家：CrewAI、AutoGen、LangGraph（开源框架），暂无商业化领头羊。

反共识 3：「Agent OS」

下一代「操作系统」——所有应用都是 Agent，而不是 GUI App。

候选玩家：Cognition (Devin)、Manus、OpenAI Operator——但都还远未成熟。

反共识 4：垂直 Agent + 硬件

把 Agent 部署到物理设备：

销售 Agent 嵌入门店摄像头 + POS
客服 Agent 嵌入电话呼叫中心硬件
教育 Agent 嵌入交互式硬件

候选玩家：基本是空白——这是天际「软硬一体」逻辑可以延伸的方向。

12.11 中国 Agent 创业者的 3 个独特机会

机会 1：制造业 Agent

中国是全球制造业第一——AI Agent 嵌入工业流程是巨大机会：

质检 Agent（替代人工质检）
排产 Agent（动态优化生产线）
物流 Agent（仓储 + 配送优化）
设备运维 Agent（预测性维护）

中国制造业 IT 预算约 1 万亿人民币，5% 转向 AI Agent 即 500 亿人民币市场。

机会 2：跨境电商 Agent

中国跨境电商 GMV 超过 5 万亿——AI Agent 在选品 / 营销 / 客服 / 运营各环节都有机会：

选品 Agent（亚马逊 / TikTok 数据分析）
营销 Agent（多语言广告投放）
客服 Agent（24x7 多语言）
物流 Agent（跨境通关）

机会 3：政企服务 Agent

中国央国企 + 政府 IT 预算约 5000 亿——AI Agent 切入：

公文 Agent（自动起草、审核）
项目 Agent（招投标、合同管理）
智能客服 Agent（市民服务）
监管 Agent（数据合规审查）

但注意：政企赛道周期长、回款慢、监管严——只适合特定团队。

12.12 Agent 创业的「18 个月生死线」

基于 30 多个 Agent 创业案例的复盘，我提炼出**「18 个月生死线」**：

月份	关键里程碑	失败信号
0-3	Demo 出来	没有 Demo = 立即 pass
3-6	第一个付费客户	0 付费 = 警告
6-9	5-10 个付费客户 + ARR 30 万美金	< 3 客户 = 红旗
9-12	ARR 100 万美金	< 50 万 = 准备 quit
12-18	ARR 300 万美金 + A 轮启动	增长停滞 = quit

任何一个 milestone 超期 3 个月以上且没有强解释，质疑团队执行力。

12.13 Agent 估值锚点（2026 Q2 实战参考）

不同阶段的 Agent 公司合理估值（笔者实战经验，仅供参考）：

阶段	ARR	合理估值范围
Pre-Seed	0	$5-15M
Seed	$0-300K	$15-40M
Pre-A	$300K-1M	$40-80M
A	$1M-5M	$80-200M
B	$5M-20M	$200M-1B
C	$20M-100M	$1B-5B
D+	$100M+	$5B+

注意：

这些是「真应用」的合理估值
「套壳」应用的估值打 5-7 折
「通用 Agent candidate」（如 Cognition）估值溢价 2-3x
创始人含金量（如杨植麟级别）估值溢价 1.5-2x

本章小结

Agent 是 AI 应用层的下一代操作系统——但成熟需要时间。

Agent vs Copilot vs Workflow 三类产品必须区分。只有「自主规划 + 工具调用 + 长程执行 + 错误恢复」四件套才是真 Agent。

5 个赛道方向：通用、编码（最成熟，Cursor 100 亿）、垂直行业（最稳，Harvey / Glean）、销售营销、消费级（最难）。

中国 Agent 崛起：Manus 全球出圈证明中国小团队也能做世界级 Agent。

4 种收钱方式：token、结果、席位、场景——选择决定单价和粘性。

4 个技术节点：长程任务、工具调用稳定性、记忆系统、多 Agent 协同。

投资判断：短期押垂直，中期通用跑通，长期 Agent vs LLM 融合。

9 项尽调清单 + 3 个陷阱（通用即万能、Workflow 包装、估值套利）。

引用

[1] 新浪财经 (2025-09-07)：雷军和张一鸣背后的女人，正在寻找下一个字节
[2] 各 Agent 公司公开融资数据（Cursor / Cognition / Glean / Harvey / Manus）
[3] CrewAI / AutoGen / LangGraph 开源项目 README

Keyboard shortcuts

AI 风投心法