
原来顶尖AI研究员靠信念在黑暗中摸索,这个细节值得告诉关注技术本质的同事。

预训练未到尽头,AI行业真相揭秘 事件脉络与关键事实
近期,曾在Anthropic参与Claude开发、后加入Google DeepMind研发Gemini 3 Deep Think的AI研究员姚顺宇,在一档播客中分享了他对当前AI行业的深度观察。他明确指出,所谓“预训练撞墙”“Scaling Law失效”等流行说法并不成立,真正限制进展的往往是工程中的未修复bug,而非规律本身。在顶级机构内部,预训练能力仍在持续增强,研究人员依赖经验、直觉与信念在未知领域探索。
姚顺宇强调,当前AI研发仍建立在经验规律之上,类似18世纪的热力学,缺乏对微观机制的完整理解。他透露,自己90%以上的代码由AI生成,工作重心已从“写代码”转向“设计逻辑”与“判断输出”。这种现实与公众对“手写代码”的浪漫想象形成鲜明对比。
在商业模式上,他认为“套壳”创业唯有快速占领用户心智或选择小众市场才可能存活,Cursor尚未逃出Anthropic引力,而Mid Journey因市场小得以独立。他首次公开承认“蒸馏”普遍存在,但区分了不道德的“硬蒸”与技术有趣的“软蒸”。对于苹果AI进展缓慢,他归因于难以吸引顶尖人才。至于人形机器人,他判断行业尚未到达“GPT-1时刻”,泛化能力远未成熟。
事实
- 姚顺宇为清华物理系特奖得主,斯坦福物理博士,曾任职Anthropic参与Claude开发,后加入Google DeepMind参与Gemini 3 Deep Think研发
- 姚顺宇指出预训练未达极限,行业所谓‘撞墙’多因未修复的工程bug,而非Scaling Law失效
- 他认为Scaling Law目前仍是经验规律,缺乏对微观机制的科学解释,类似18世纪的热力学
- 姚顺宇透露自己90%以上的代码由AI生成,工作重心在于设计逻辑与审查输出
- 他首次公开承认蒸馏在行业中普遍存在,区分‘硬蒸’(直接复制输出)与‘软蒸’(作为训练辅助)
- 姚顺宇判断人形机器人行业尚未到达‘GPT-1时刻’,缺乏语言模型那样的泛化能力
Canto 的可视化新闻解读。制作过程可能有 AI 辅助。 编辑政策





