deepseek创始人访谈录

Posted by     "虞天" on Saturday, February 1, 2025

中国大模型突围战:一场关于创新信念的觉醒运动

——从DeepSeek的探索看中国AI的生态突围


引言:当"跟随者"决定走向牌桌

ChatGPT掀起的AI浪潮让全球重新审视技术创新的权力格局,但是在2025年,一个耐人寻味的现象是:硅谷的咖啡厅里开始频繁出现"DeepSeek"这个来自中国的名字。当美国开发者发现一家中国公司的大模型代码出现在GitHub热门仓库时,他们的反应印证了对话中那句预言——“DeepSeek会让硅谷的很多人惊讶的”。这种惊讶背后,折射出全球技术圈对中国创新能力的认知偏差,也揭示了一个更深刻的命题:在重写AI技术版图的进程中,中国能否突破"应用变现者"的路径依赖?


一、创新的双重困境:资本悖论与惯性陷阱

在采访中,两位对话者尖锐指出了中国AI发展的结构性矛盾:

  1. 资源与目标的错配
    中国头部科技企业的利润规模(字节跳动2024年营收超1350亿美元)早已具备支撑长期创新的资本实力,但大模型赛道仍充斥着"三个月必须看到商业闭环"的焦虑。这种矛盾暴露了更深层的认知困境——当企业习惯将技术视为变现工具而非价值创造本身时,再丰沛的资本也难以转化为创新动能。

  2. 创新成本的认知偏差
    正如对话中所述:“我们创新缺的肯定不是资本,而是缺乏信心”。这种信心缺失源于双重历史惯性:

  • 互联网时代的成功模式塑造了"快速迭代+流量变现"的思维定式
  • 过去技术追赶阶段的"后发优势"反而成为创新者的思想枷锁

这种惯性在产业实践中表现为:企业更愿意在推荐算法上投入百人团队优化0.1%的CTR(点击通过率),却对需要5年周期的基础模型研究犹豫不决。


二、重构护城河:当开源成为文化基因

面对"如何建立壁垒"的经典商业拷问,DeepSeek给出了反直觉的答案:

# 传统商业逻辑
def build_moat():
    return patents + exclusive_tech + closed_ecosystem

# DeepSeek的选择
def build_nextgen_moat():
    return open_source + talent_culture + innovation_ecosystem

这种选择背后是对技术本质的深刻洞察:

  • 动态护城河理论:在指数级进化的AI领域,任何静态技术优势都将被快速迭代瓦解(如Transformer架构颠覆了传统NLP技术栈)
  • 人才复利效应:通过开源构建技术社区的"飞轮效应",吸引更多开发者共同培育创新土壤
  • 文化势能积累:当企业的技术输出成为行业基准时(如PyTorch之于Meta),其品牌将获得超越商业的价值认同

这解释了为什么DeepSeek将"被follow"视为荣誉——在开源社区的星标(Star)数量背后,是技术领导力的隐性货币化。


三、人才培养:非典型创新者的崛起

当海外猜测DeepSeek团队由"高深莫测的奇才"组成时,真相更值得深思:

  • 人才选拔的范式转移:从"履历光鲜度"转向"创造性张力"的评估
  • 组织架构的混沌管理:自下而上的自然分工机制,允许"非共识创新"的野蛮生长
  • 代际认知跃迁:90后/00后技术人才对"改变世界"的信念强度,远超对短期物质回报的诉求

这种人才策略的底层逻辑,与OpenAI早期团队的构建惊人相似——都选择了相信"年轻人的无畏"而非"权威的经验"。


四、生态觉醒:从技术消费者到规则制定者

对话中最具启示性的观点直指中国AI发展的终极命题:

“英伟达的领先不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。”

这揭示了创新生态的"暗物质":

  • 技术预见性:参与前沿标准制定而非被动接受技术路线
  • 社区共生性:像Linux基金会那样培育跨组织的协作网络
  • 教育反哺机制:通过开源项目培养下一代开发者,形成人才供给的"莫比乌斯环"

当中国团队开始向Hugging Face提交主流框架的优化方案时,这种生态位的变化远比单个模型的性能提升更具战略意义。


五、冷周期启示录:创新信念的应力测试

面对资本寒冬的质疑,对话给出了充满辩证智慧的回应:

  • 经济下行期的筛选效应:淘汰机会主义玩家,凸显真正创新者的价值
  • 创新成本的再定义:当"赚快钱"机会消失,社会资源将自动向硬核创新聚集
  • 代际认知迭代:正如80年代"读书无用论"在市场经济冲击下的瓦解,新一代创业者正在重写创新者的社会价值坐标

这种认知进化在产业端已现端倪:2024年国内AI领域天使轮融资同比下降超60%,但模型与基础设施相关的长期技术基金募资规模逆势增长159%。


结语:创新者的天命

站在GPT-5即将面世的前夜回看这场对话,我们或许正在见证中国技术创新的"元认知升级"。当DeepSeek们选择将代码开源、将人才视为终极资产、将生态建设置于短期利益之上时,他们实质上在进行一场关于创新信念的社会实验。

这让人想起计算机先驱Alan Kay的箴言:“预测未来的最好方式,就是创造它。“当中国创新者开始相信"技术没有秘密,但创造需要勇气"时,硅谷咖啡厅里的惊讶,终将转化为全球技术版图重构的序章。

留给中国AI的终极考题或许不是"能否赶上ChatGPT”,而是:我们是否准备好成为下一代技术范式的定义者?


引用:访谈对话录

采访者 00:00  
DeepSeek会让硅谷的很多人惊讶的。

梁文峰 00:03  
在美国每天发生的大量创新里,这是非常普通的一个,他们之所以惊讶,是因为这是一个中国公司在以创新贡献者的身份加入到他们游戏里去,毕竟大部分中国公司习惯follow,而不是创新。

采访者 00:16  
但这种选择放在中国语境里也过于奢侈。大模型是一个重投入游戏,不是所有公司都有资本只去研究创新,而不是先考虑商业化。

梁文峰 00:26  
创新的成本肯定不低,过去那种拿来主义的惯性也和过去的国情有关。但现在你看无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低,我们创新缺的肯定不是资本,而是缺乏信心,以及不知道怎么组织高密度的人才实现有效的创新。

采访者 00:45  
为什么中国公司包括不缺钱的大厂,这么容易把快速商业化当第一要义?

梁文峰 00:52  
过去30年我们都只强调赚钱,对创新是忽视的,创新不完全是商业驱动的,还需要好奇心和创造欲。我们只是被过去那种惯性束缚了,但它也是阶段性的。

采访者 01:03  
但你们究竟是一个商业组织,而非一个公益科研机构选择创新,又通过开源分享出去,那要在哪里形成护城河?

梁文峰 01:11  
在颠覆性的技术面前必然形成的护城河是短暂的,即使openAI闭源也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know to how,形成可以创新的组织和文化,就是我们的护城河。

开源发论文其实并没有失去什么,对于技术人员来说被follow是很有成就感的事。其实开源更像一个文化行为,而非商业行为,被跟随其实是一种额外的荣誉,一个公司这么做也会有文化的吸引力。

采访者 01:44  
怎么看类似朱啸虎的这种市场信仰派观点。

梁文峰 01:46  
朱啸虎是自洽的,但他的打法更适合快速赚钱的公司,你看美国最赚钱的公司都是厚积薄发的高科技公司。

采访者 01:54  
但做大模型单纯的技术领先也很难形成绝对优势。你们赌的更大的东西是什么?

梁文峰 02:01  
我们看到的是中国大模型不可能永远处在跟随的位置。

我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。英伟达的领先不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图,中国AI发展同样需要这样的生态。

很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。

采访者 02:38  
海外认为deepseek雇佣了一批高深莫测的奇才,做出deepseek的是怎样一群人?

梁文峰 02:44  
并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生,没毕业的博四博五实习生,还有一些毕业才几年的年轻人。

采访者 02:53  
很多大模型公司都执着地去海外挖人,很多人觉得这个领域前50名的顶尖人才可能都不在中国的公司,你们的人都来自哪里?

梁文峰 03:03  
大模型没有海外回来的人,都是本土的,前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

采访者 03:11  
听说你们很擅长从细节招人,让一些非传统评价指标里优秀的人被选出来。

梁文峰 03:17  
我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历很有意思,很多人对做研究的渴望远超对钱的在意。

采访者 03:27  
这种发散性灵感的诞生和你们完全创新型组织的架构很有关系,但ACI这种充满不确定性的前沿探索,是否做了管理动作。

梁文峰 03:37  
管理也全是自下而上,而且我们一般不前置分工是自然分工,每个人有自己独特的成长经历,都是自带想法的,不需要迫使他探索过程中他遇到问题,自己就会拉人讨论,不过当一个idea显示出潜力,我们也会自上而下地去调配资源。

采访者 03:56  
你觉得创新很大程度也是一种偶然吗?

梁文峰 03:59  
我觉得创新首先是一个信念问题,为什么硅谷那么有创新精神,首先是敢,chatGPT出来是,整个国内对做前沿创新都缺乏信心,从投资人到大厂都觉得差距太大了,还是做应用。但创新首先需要自信,这种信心通常在年轻人身上更明显。

采访者 04:20  
大部分中国公司都选择既要模型又要应用,为什么deepseek目前选择只做研究探索。

梁文峰 04:26  
因为我们觉得现在最重要的是参与到全球创新的浪潮里去,过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然,这一波浪潮里我们的出发点就不是趁机赚一笔,而是走到技术的前沿去推动整个生态发展。

采访者 05:09  
现在经济开始进入下行,资本也进入冷周期,所以它对原创式创新是否会带来更多抑制?

梁文峰 05:15  
我倒觉得未必中国产业结构的调整会更依赖硬核技术的创新。

当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。

采访者 05:28  
技术真的可以拉开差距吗?你也说过并不存在绝对的技术秘密。

梁文峰 05:33  
技术没有秘密,但重置需要时间和成本,英伟达的显卡理论上没有任何技术秘密,很容易复制,但重新组织团队以及追赶下一代技术都需要时间,所以实际的护城河还是很快。

采访者 05:46  
互联网和移动互联网时代留给大部分人的惯性认知是美国擅长搞技术创新,中国更擅长做应用。

梁文峰 05:53  
我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。

过去30多年,IT浪潮里我们基本没有参与到真正的技术创新里,我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件,但其实这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。

采访者 06:21  
你对国内原始创新也是乐观的吗?你对国内原始创新也是乐观的。

梁文峰 06:26  
我是80年代在广东一个五线城市长大的,我的父亲是小学老师,90年代广东赚钱机会很多,当时有不少家长到我家里来,基本就是家长觉得读书没用,但现在回去看观念都变了,因为钱不好赚了,连开出租车的机会可能都没了,一代人的时间就变了,以后硬核创新会越来越多,现在可能还不容易被理解,是因为整个社会群体需要被实施教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变,我们只是还需要一堆事实和一个过程。

「真诚赞赏,手留余香」

YuTian Blog

真诚赞赏,手留余香

使用微信扫描二维码完成支付