预训练未到尽头，AI行业真相揭秘

一位年轻研究员站在充满数据流与神经网络图的黑板前，神情坚定，背景是AI模型训练的动态光效

科技作者 June 2026年5月19日 05:27

原来顶尖AI研究员靠信念在黑暗中摸索，这个细节值得告诉关注技术本质的同事。

预训练未到尽头，AI行业真相揭秘 事件脉络与关键事实

近期，曾在Anthropic参与Claude开发、后加入Google DeepMind研发Gemini 3 Deep Think的AI研究员姚顺宇，在一档播客中分享了他对当前AI行业的深度观察。他明确指出，所谓“预训练撞墙”“Scaling Law失效”等流行说法并不成立，真正限制进展的往往是工程中的未修复bug，而非规律本身。在顶级机构内部，预训练能力仍在持续增强，研究人员依赖经验、直觉与信念在未知领域探索。

姚顺宇强调，当前AI研发仍建立在经验规律之上，类似18世纪的热力学，缺乏对微观机制的完整理解。他透露，自己90%以上的代码由AI生成，工作重心已从“写代码”转向“设计逻辑”与“判断输出”。这种现实与公众对“手写代码”的浪漫想象形成鲜明对比。

在商业模式上，他认为“套壳”创业唯有快速占领用户心智或选择小众市场才可能存活，Cursor尚未逃出Anthropic引力，而Mid Journey因市场小得以独立。他首次公开承认“蒸馏”普遍存在，但区分了不道德的“硬蒸”与技术有趣的“软蒸”。对于苹果AI进展缓慢，他归因于难以吸引顶尖人才。至于人形机器人，他判断行业尚未到达“GPT-1时刻”，泛化能力远未成熟。

事实

姚顺宇为清华物理系特奖得主，斯坦福物理博士，曾任职Anthropic参与Claude开发，后加入Google DeepMind参与Gemini 3 Deep Think研发
姚顺宇指出预训练未达极限，行业所谓‘撞墙’多因未修复的工程bug，而非Scaling Law失效
他认为Scaling Law目前仍是经验规律，缺乏对微观机制的科学解释，类似18世纪的热力学
姚顺宇透露自己90%以上的代码由AI生成，工作重心在于设计逻辑与审查输出
他首次公开承认蒸馏在行业中普遍存在，区分‘硬蒸’（直接复制输出）与‘软蒸’（作为训练辅助）
姚顺宇判断人形机器人行业尚未到达‘GPT-1时刻’，缺乏语言模型那样的泛化能力

Canto 的可视化新闻解读。制作过程可能有 AI 辅助。编辑政策

事实

AI开始接管科研中最苦的活

编程教学迎来转折点

AI幻觉，能被数学解决吗？

国产光刻胶树脂突破‘黑箱’依赖

国产GPU芯片10年内逆袭？