马斯克花100亿买来的关键教训

一幅科技风格插画：左侧是马斯克站在SpaceX标志旁手持巨额支票，右侧是Cursor的AI编程界面不断输出代码，中间用数据流连接，象征100亿美元背后的数据争夺战。

科技作者 June 2026年5月18日 17:37

顶级编程模型的竞争，已经变成谁更懂真实用户操作的过程，这个变化对关注AI进化的技术同事来说，是个可以一起看的背景。

马斯克花100亿买来的关键教训 事件脉络与关键事实

马斯克旗下的SpaceX与编程AI工具Cursor达成战略合作，可能支付高达100亿美元合作费，或以600亿美元收购。这一举动背后，是AI行业对高质量训练数据的战略争夺。当前，顶级编程模型的竞争已从单纯依赖公开代码库，转向获取真实用户在coding agent产品中的操作轨迹——包括提示、思考、规划、代码输出与验证的完整过程，即“Agentic Loop”。这类数据能支持“过程监督”式强化学习，显著提升模型在真实场景中的表现。

Cursor通过其Composer 2模型展示了这一路径的有效性：尽管初期基于Kimi K2.5底座，但通过在真实产品环境中进行“实时强化学习”，每几小时迭代一次模型，最终训练出超越基座的专有编程能力。其代码补全功能Tab的用户接受率提升28%，拒绝率下降21%，验证了数据飞轮的价值。相比之下，缺乏自有coding agent产品的厂商，如DeepSeek，虽在部分基准测试中表现尚可，但在更贴近真实工程的SWE-bench Pro上得分骤降，反映出其训练数据的局限性。

行业趋势显示，Anthropic、OpenAI、阿里巴巴、MiniMax等头部厂商均已推出或升级自有coding agent产品，如Claude Code、Qoder 1.0、Mavis等。即便是长期克制的DeepSeek，也于2026年启动Agent相关岗位招聘，表明“模型即产品、产品即数据”的闭环已成为AI进化的必要条件。未来，没有自研coding agent的模型厂商将难以获取on-policy数据，技术护城河或将逐渐瓦解。

事实

2026年5月，SpaceX与Cursor宣布战略合作，可能支付100亿美元合作费或以600亿美元收购。
Cursor通过在真实产品环境中进行实时强化学习，每5小时迭代一次Composer 2模型，显著提升代码建议接受率。
缺乏自有coding agent产品的模型如DeepSeek，在SWE-bench Pro等真实工程基准测试中得分仅为15%左右。
阿里巴巴于2026年5月15日发布Qoder 1.0，正式升级为智能体自主开发工作台。
Anthropic在2025年11月论文中确认，使用员工使用Claude Code的交互数据反哺模型训练。
DeepSeek于2026年3月发布多个Agent相关岗位，表明将启动自研coding agent产品。

Canto 的可视化新闻解读。制作过程可能有 AI 辅助。编辑政策

事实

DeepSeek拟募资最高500亿

风暴中的Manus：一只蝴蝶的振翅与坠落

AI开始接管科研中最苦的活

苹果AI耳机H90首秀在即

华为开源灵犀指令集