Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

第 3 章 · 押骑师不押马:AI 创始人的新画像

核心心法:Bet on the Jockey, Not the Horse —— 押骑师,不押马。 AI 时代的重写:骑师没变,但评判骑师的标尺重新刻度——必须叠加「真懂 AI」+「速度」两条新维度。


3.1 引子:一个高中辍学的创始人

2023 年某天,张倩在苏州第一次见到张路宇——Dify 的创始人。

她后来在一次访谈里描述这次会面:

「张路宇高中辍学,没读完高中。但我见到他的时候,他眼里在发光。他的核心团队和他在一起干了十几年——程序员、产品、设计——挤在一起,有超强的凝聚力

当时他们的产品 Dify 还很早期,我们都看不清商业模式。但我做了一个决定:投这个团队

因为我相信一件事:这个团队本身就很强,足够值得投资——商业模式可以慢慢摸索出来,但这种『眼里有光』的团队,是稀缺资产。」[1]

3 年后回头看:

  • Dify 全球安装量超 40 万[2];
  • 中国约 70% 用大模型做应用的公司都是它的客户;
  • 海外营收占比超 50%——张倩亲自带它去 GTC 拓展北美市场;
  • 这个曾经看不清商业模式的项目,今天是中国最受关注的 AI 应用平台之一。

张倩没有押 Dify 的「商业模式」(horse),她押了张路宇这个团队(jockey)

这就是这一章要讲的第三条心法:Bet on the Jockey, Not the Horse

但这条心法在 AI 时代有一个关键的新刻度:「骑师」的标准,从「学历 + 大厂经验 + 二次创业」升级为「真懂 AI + 速度


3.2 心法陈述:骑师的科学

3.2.1 经典版本:押骑师不押马

Strebulaev 在 The Venture Mindset 里讲得很清楚:

Horse vs Jockey 的辩论从 VC 出现的第一天就在了——投人还是投生意?

VC 的结论一边倒:投人。」[3]

为什么?因为:

  1. 生意会变:每个伟大公司的最终业务,往往和创业初期完全不同——X.com 变成 PayPal,Confinity 变成 PayPal,Burbn 变成 Instagram,Tote 变成 Pinterest,Odeo 变成 Twitter;
  2. 市场会变:你今天看好的赛道,2 年后可能被颠覆;
  3. 唯一不变的是「:好的创始人会在生意 / 市场变化时,带着团队跨越每一次转弯

Strebulaev 引用了 First Round Capital 的一份内部研究:他们追踪了 600 多家投资过的公司,发现「创始人质量」对最终回报的解释力,比「初创业务的市场吸引力」高 2-3 倍[3]。

中国的版本同样成立。张倩在 2023 年访谈说过:

「**我们投过的案例里,比如张一鸣、雷军,他们都是非常有天分的程序员出身,同时学习能力很强,潜力很大。**他们最终做出来的公司,和最初的 BP 都不一样——但他们都做出来了。」[4]

这就是经典版「押骑师」的内核。

3.2.2 移动互联网时代的骑师画像

把张倩 2010-2020 年间的成功案例(字节跳动、小米、美团、蔚来、金山云)做交叉分析,可以提炼出 移动互联网时代骑师 5 维画像

维度描述张一鸣雷军王兴李斌
1. 技术深度程序员出身或深度技术理解
2. 二次/三次创业已有过失败或退出经验△(早期)
3. 学习能力跨领域快速适应
4. 大厂或行业 sense知道产业的「真实细节」
5. 长期主义愿意 5-10 年熬一件事

这 5 维是「经典 VC 看人」的标准模板。在移动互联网时代,符合这 5 维的人,跑出 Home Run 的概率显著高于平均。

3.2.3 AI 时代的重写:必须新增 2 条

但到了 AI 时代,张倩明确加了 2 条新维度——她在 2025 年 9 月访谈里反复强调

「我看 AI 创业者,最看重两件事

第一,对 AI 技术的认知——不要求科班出身,但要对行业内的技术进展了如指掌。我会问他们:transformer、scaling law、MoE、RLHF 这些每一个,你怎么看?你的判断是什么?

第二,速度——在 AI 这个快速发展的行业,时间就是生命,速度决定成败。我见过很多『创业一年多了,还拿不出 Demo』的——这就是问题。」[5]

为什么必须新增这 2 条?

为什么「真懂 AI」是新刚需

移动互联网时代,技术深度是「nice to have」——你可以是一个产品 + 商业人才,找一个 CTO 配你。

AI 时代不行。原因:

原因 A:技术 = 战略

在移动互联网时代,「用什么后端框架」「用什么数据库」是技术决策——它影响 cost,但不决定产品形态。

在 AI 时代,「用什么模型架构」「自训还是微调」「长上下文还是 RAG直接决定产品形态。一个 transformer 时代的 Agent 产品和一个 Mamba 时代的 Agent 产品,用户体验差距是数量级的

如果创始人不真懂 AI 技术,他不会知道 6 个月后什么是「新可能——他会把战略停留在「今天的能力边界」。

原因 B:技术 = 速度

AI 时代的迭代周期是 6 周(一个 minor model release 周期)。如果创始人不懂技术,他每次「跟进新技术」都要走完 internal communication → CTO 解释 → 产品调整 → 工程实现——这个流程往往 2-3 个月。

而懂技术的创始人,自己读 paper,自己 prototype——决策周期 1 周。速度差 10 倍

原因 C:技术 = 沟通

AI 创业公司的核心稀缺资源是 AI 人才。懂技术的创始人,能在面试时直接挑战候选人的技术深度——这是最强的人才磁吸。

不懂技术的创始人,必须依赖 CTO 做面试——这 layer 一加,最顶尖的人才会跑去自己直接和创始人对话的公司

所以「真懂 AI」不是技能要求,是战略 / 速度 / 人才三个维度的复合刚需

为什么「速度」是新刚需

移动互联网时代,慢一点不是死。微信 2011 年上线,对标的米聊和 Talkbox 都还活着——只是慢慢被甩开。

AI 时代,慢一点是死。原因:

  • 模型能力 6 周一升级——你的产品差异化窗口最多 3 个月;
  • 估值飞涨陡峭——晚一轮融资估值翻倍;
  • 创始人之间的差异化主要在执行——idea 越来越不值钱,执行速度变成核心 alpha

张倩的判断很直接:

创业一年多了,还拿不出 Demo——这就是问题。」[5]

我把这条标准展开为可量化指标:

阶段期望时间具体里程碑
创立 → 第一版 Demo1-3 个月内部能跑
创立 → 公开 Beta3-6 个月100 个外部用户
创立 → 第一笔付费6-9 个月第一个付费客户
创立 → PMF 信号12 个月月留存 40%+ / NRR 100%+
创立 → A 轮融资12-18 个月主流 VC 主动接洽

任何一个里程碑超期 6 个月以上,且没有强解释的,骑师评分降一档


3.3 中国案例:3 个 AI 时代的骑师画像

3.3.1 杨植麟(月之暗面 / Kimi):学院派 + 商业 sense 的复合体

背景

  • 卡内基梅隆大学博士(NLP 方向)
  • Google Brain、Meta AI 研究员
  • 师从 Ruslan Salakhutdinov(深度学习教父之一)
  • 2023 年回国创立月之暗面

为什么是好骑师

  1. 真懂 AI 技术:transformer 时代核心研究者,发表过被引用 1000+ 的论文;
  2. 速度:2023 年成立,2024 年初推出 Kimi(公开 Beta),6 个月内做到中国 C 端 ChatGPT 替代品最大单一应用
  3. 学习能力:从纯学术研究者快速转型为带产品 / 商业团队的 CEO,2 年内把估值做到 200 亿美金[6]。

张倩的判断逻辑(从公开访谈推断):

  • 杨植麟代表了「学院派创始人 + 速度执行力」的稀缺组合;
  • 月之暗面 2024 年的 Kimi C 端突围,证明这一组合的执行力超出市场预期。

但同时要注意——杨植麟也有典型的「学院派创始人」风险

  • 学术派对「商业模式」的敏感度通常不如商业派;
  • 与 OpenAI / Anthropic 等团队相似,烧钱速度高于营收增长速度

这是为什么张倩 2025 年的判断是「这一代走 Scaling Law 路线的大模型,是大公司才能玩的」[7]——她没有重仓 Kimi 这种基础模型公司,但她承认杨植麟是好骑师

3.3.2 梁文锋(DeepSeek):「反共识」骑师的极致样本

背景

  • 浙江大学信息与电子工程学士、硕士
  • 创立幻方量化,做量化交易,2015 年起家;
  • 2021 年开始组建 DeepSeek AI 团队(作为幻方内部研究项目);
  • 2023 年 DeepSeek 独立运作;
  • 2025 年初 DeepSeek-V3 / R1 发布,全球开源 AI 排名第一[8]。

为什么是好骑师

  1. 真懂 AI 技术:自己写 paper、自己拍板模型架构(V3 的 MLA 注意力 + DeepSeekMoE 都是他和团队的原创创新);
  2. 速度:内部憋了 5 年(2021-2025),但一旦发布就用极快速度迭代——V3 → R1 → V3.5,每 2-3 个月一个大版本;
  3. 反共识:在所有人卷大参数模型时,他选择用「极致工程优化 + MoE」做出 1/10 训练成本的对标 GPT-4 模型——这不是技术赛跑,是路线赛跑。

核心特征:5 年准备 + 6 个月爆发的骑师

这种类型的骑师在传统 VC 视野里不容易识别——因为他们不到爆发那一刻,看起来都「没什么动静」。VC 在 2024 年之前不会主动找梁文锋——但他们错过的代价是:DeepSeek 估值从 100 亿到 450 亿美金的飞涨[8]。

启发:好骑师有时会潜伏。建立长期 sourcing 关系比「等他出来融资」重要 100 倍

3.3.3 张路宇(Dify):「眼里发光」的高中辍学骑师

我们已经在引子里详细讲了 Dify。

为什么张路宇是好骑师(按张倩的判断):

  1. 真懂 AI 技术:虽然没有大厂或学术经历,但对开源社区、LLM 应用、Agent 框架有第一手实战感——这种 sense 不是 reading paper 来的,是自己写代码、被 GitHub 用户怼、迭代上百次养出来的。
  2. 速度:2023 年发布 Dify,2025 年达到 40 万全球安装量——2 年从 0 到行业 #1 开源 LLM 应用平台
  3. 凝聚力:核心团队跟他干了十几年——这种凝聚力比融资能力更稀缺

张路宇代表了「学历 ≠ 骑师质量」的典型样本——这也是张倩反复强调的:

不要求科班出身,但要对行业内的技术进展了如指掌。」[5]

「真懂 AI」可以来自学术训练(杨植麟),可以来自工程实践(梁文锋早期路径),也可以来自开源社区+自学(张路宇)。路径可以多元,深度不能打折


3.4 硅谷对照:Sam Altman vs Sundar Pichai

3.4.1 Sam Altman:YC 时代的「最强骑师选拔器

Y Combinator(YC)历任掌门人 Paul Graham、Sam Altman 都说过类似的话:

YC 的核心方法不是教创业,是『选好骑师——我们看 1000 个创始人,选 200 个进 batch,我们的回报 80% 来自这 200 个里的前 10 个。」[9]

Sam Altman 自己后来作为 OpenAI CEO 也成了一个 case study。他不是 PhD,不是技术 lead——但他在以下两个维度上极强:

  1. 真懂 AI:他不写 paper,但他能用 1 小时和 Ilya Sutskever 讨论 transformer 内部细节——这是他多年和顶级研究者深度互动养出来的 sense;
  2. 速度:OpenAI 从 ChatGPT 发布(2022.11)到 GPT-4(2023.03)只有 4 个月,这种速度需要 CEO 自己懂技术 + 推动决策

但 Altman 也不是没有争议——他在 2023 年被董事会短暂解雇又复职,反映了一个深层问题:当骑师太强,董事会能否制衡他?这是另一个话题(详见第 5 章 Agree to Disagree)

3.4.2 Sundar Pichai:「学习型骑师」的另一种范式

如果 Altman 是「激进型骑师」,Sundar Pichai 是「学习型骑师」。

他在 Google 内部做了 15 年——从 Chrome 项目经理升到 CEO。他没有创业经历,没有 PhD(虽然有斯坦福 MS),不是世界顶级 AI 研究者——但他做对了一件事:在 Google 因 ChatGPT 而焦虑时,他没有恐慌

2024 年 Pichai 在一次访谈里说:

「ChatGPT 出来的时候,外界以为 Google 会输。但我们知道,搜索的核心是『回答用户问题』——LLM 让我们能更好地回答,但用户『搜索』的本能没变

所以我们没有把 Bard / Gemini 变成 ChatGPT 的 clone,而是把它深度集成到搜索体验——这是一场长期战,不是一次产品发布的胜利。」[10]

Sundar Pichai 体现了另一种骑师特质:沉得住气」+「结构性判断。这种类型的骑师在「老牌大公司转型」的 case 里特别稀缺。

启发:骑师有多种类型,没有一种是「唯一正确」的。VC 的工作是识别哪种类型适合哪种 stage 和 type 的公司——而不是用一种模板套所有人。


3.5 反例与陷阱:骑师画像的 5 个误区

误区 1:「履历光鲜」≠「好骑师

2018-2022 年,中国 AI 一级市场涌现大量「前 BAT P9+」「前 Google Brain 研究员」「前 Anthropic 高级工程师」创业团队。

履历是真的,但履历不等于创业能力

我看到的几种典型 fail mode:

  1. 职业经理人创业:曾经是大厂高管,习惯了内部资源 / 流量 / 信任红利,自己创业时无法从 0 拿到客户、招到人、撑住现金流
  2. 学术派创业:曾经发表过 NeurIPS / ICML 论文,但不会做产品、不会卖货——3 年后拿不出 Demo;
  3. 关系派创业:靠朋友圈关系做 sourcing 和招人,没有真正的产品和市场判断——融资轮次靠人情而非数据。

正确做法:履历是「初筛通过条件」,不是「投资决策依据。深度 DD 必须验证执行力。

误区 2:「有梦想」≠「有路径

每个 AI 创业者都说「我们要做下一个 OpenAI」「改变世界」。

梦想越大越好——但没有路径的梦想等于幻觉

判断方法:

  • 让创始人讲:「我们要做下一个 OpenAI——具体来说,未来 18 个月你要做哪 5 件事,每件事的 milestone 是什么?**」
  • 如果他能讲出具体、可量化、有逻辑链条的 18 个月路径图——好骑师;
  • 如果讲不出来,或者讲的是「先做 PMF,再扩张,再国际化」这种空话——pass。

误区 3:「反向背书」陷阱

红杉 lead 了 A 轮」「a16z partner 个人天使了」——这些信号在 AI 时代经常被滥用。

为什么?因为:

  1. 顶级 VC 也会犯错(参见 1.4 节 Bessemer Anti-Portfolio);
  2. partner 个人天使」和「基金 lead」是两回事——前者经常只是 50 万美金试水;
  3. 名 VC 早期投的项目,很多最终是「陪跑」状态,没有兑现回报。

正确做法:别人的背书是参考信号,不是决策依据自己做 DD,自己判断

误区 4:「家世」陷阱

xx 二代」「xx 之子」——这种信号在某些 fund 内部被当作「资源加分项」。

但实际上,家世和创业成功率几乎不相关,甚至负相关

  • 含着金钥匙出生」的创始人,往往对失败的容忍度低——他们没有「输不起」的紧迫感;
  • 靠家庭关系开局」的项目,早期表现往往虚高(资源带来的增长非自然增长),后期会暴露问题。

正确做法:家世可以是 sourcing 渠道(你怎么认识到这个项目),但不是投资决策依据

误区 5:「只看 1 次」就下决心

很多 VC 和创始人只见 1-2 次就开始谈 term sheet。这在估值飞涨的 AI 时代很常见——速度压力让 VC 无法做长期观察

但好骑师的判断通常需要至少 3 次互动

  1. 第一次:讲故事,听他怎么 frame 自己;
  2. 第二次:技术深度,挑战他对 AI 的认知;
  3. 第三次:复盘,问他「过去 6 个月你最大的失败 / 反思是什么」——如果他答不出来或者只说成功,pass。

如果时间紧迫,可以把这 3 次压缩到 2 周内,但不要省


3.6 落地清单:AI 时代的骑师 14 项尽调清单

把这一章的方法论翻译成可操作工具——给 VC 投资人在 DD 时使用的 14 项「骑师质量检查表

A. 技术深度(4 项)

  1. 挑战 transformer 架构:「你怎么看 MoE vs 稠密模型?为什么?」——能讲出 trade-off 的,good。说不清楚的,红旗。
  2. 挑战 scaling law 判断:「你认为 scaling law 还有多少代际可以走?什么时候会撞墙?」——能给出有数据支持的判断,good。说「没人知道」的,问题。
  3. GitHub / arxiv 检索:创始人 / 核心团队是否有 transformer 时代的真实工作?哪怕是开源贡献?
  4. 产品技术 review:让创始人逐行解释他们的 system design——多久能讲明白?讲不明白的,CTO 是不是真在做主?

B. 速度(3 项)

  1. 里程碑达成率:让创始人列出过去 12 个月的 OKR / 里程碑——哪些达成,哪些超期。超期 50%+ 且没有结构化解释的,红旗。
  2. 决策周期:问「你们上一次重大产品调整是什么时候?花了多长时间决策?」——决策超过 4 周的,速度有问题。
  3. DDL 文化:和团队中层 / 工程师聊天——「你们公司的 deadline 文化怎么样?是不是经常 ship」——如果团队没有 shipping cadence,骑师没有 push 到位。

C. 学习能力(3 项)

  1. 最近读了什么 paper / book:好骑师每周至少 3-5 篇 paper / 1 本好书。
  2. 最近最大的认知升级是什么:好骑师能讲出具体的、最近 3 个月内的认知更新。说「没什么变化」的,learning rate 低。
  3. 你哪里错了:让创始人讲一个他过去 12 个月内的判断错误。能讲且复盘到位的,high learning。讲不出或推卸责任的,low learning。

D. 凝聚力(2 项)

  1. 核心团队的 stick rate:核心团队成员中,多少人和创始人合作 5 年+?10 年+?数字越高越好(但要平衡多元性)。
  2. team retention 数据:过去 12 个月公司离职率?关键岗位是否动荡?

E. 长期主义(2 项)

  1. 你最长能 hold 多久不出来融资:好骑师能讲出 18-24 个月的 runway plan。讲「必须 6 个月内拿到下一轮」的,cash flow 紧张,决策会变形。
  2. 5 年后这家公司是什么样:好骑师能讲一个清晰的 5 年愿景——而不是「我们看 6 个月」。

评分规则

  • 每项 0-3 分(0 = fail,1 = poor,2 = good,3 = excellent)
  • 总分 42 满分
  • 35+ 分:A 级骑师,强烈推荐进入深度 DD
  • 25-34 分:B 级骑师,进入有条件 DD(重点 verify 弱项)
  • <25 分:pass

本章小结

Strebulaev 的「Bet on the Jockey」在 AI 时代仍是 VC 的核心心法——但评判骑师的标尺重新刻度

移动互联网时代的 5 维画像(技术深度 / 二次创业 / 学习能力 / 行业 sense / 长期主义)依然有效,但必须叠加 2 条新维度

  1. 真懂 AI——不要求科班出身,但要对行业内技术进展了如指掌
  2. 速度——时间就是生命,速度决定成败。

中国一线案例(杨植麟 / 梁文锋 / 张路宇)展示了 3 种不同的 AI 时代骑师范式:学院派 + 速度反共识 + 长期潜伏开源社区 + 凝聚力

硅谷对照(Sam Altman / Sundar Pichai)提醒我们:骑师有多种类型,VC 的工作是识别哪种类型适合哪种 stage 和 type 的公司

避免 5 个误区:履历光鲜陷阱、有梦想没路径、反向背书陷阱、家世陷阱、只看 1 次就下决心。

实操工具:14 项骑师尽调清单——4 项技术深度 + 3 项速度 + 3 项学习 + 2 项凝聚力 + 2 项长期主义,42 分满分制。

押骑师的本质,是相信「伟大的人会带着平凡的生意走向不平凡的终点


延伸阅读

  1. The Venture Mindset (Strebulaev & Dang, 2024) — 第 5 章 “Bet on the Jockey”
  2. First Round Capital “Founder Quality Research
  3. Y Combinator Paul Graham 论文集 — “How to Pick Cofounders”
  4. Sam Altman 公开演讲与播客(OpenAI 内部沟通节选)
  5. 张倩 / 天际资本 新浪 2025-09 长报道

思考题

  1. 用本章「14 项尽调清单」给你过去 12 个月接触的 5 位创始人打分。哪几位 35+?哪几位 <25?事后看,他们的项目表现是否和你的打分相关?
  2. 假设你是一个 AI 创业者,请用「5 维 + 2 维」的标准自评——你的弱项是哪几条?如何 18 个月内补强?
  3. 杨植麟、梁文锋、张路宇代表 3 种不同的骑师范式。如果你只能投 1 个,你会选哪个?为什么?(注意:这个问题没有正确答案,意在测试你对「骑师 - 项目 - stage」匹配的判断)

引用