在Anthropic和DeepMind训模型的物理博士，说了AI圈最不中听的大实话

AI 训练 Anthropic OpenAI 到头

发布于 2026-06-09

279

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：在Anthropic和DeepMind训模型的物理博士，说了AI圈最不中听的大实话

文章来源：

一个数据人的自留地

扫码关注公众号

扫码阅读

手机扫码阅读

文章主旨：AI行业最稀缺的不是天才智力，而是靠谱、细致、可靠的执行力与系统化能力，当前AI研究已进入工程化协作时代，个人英雄主义失效。

关键要点：

Claude写代码领先GPT是偶然发现的战略升级，核心原因是代码场景具备清晰反馈信号和充分数据，使大规模强化学习成为可能。
预训练Scaling Law并未见顶，多数“撞墙”案例源于技术实现中的bug，而非规律失效；当前瓶颈从“能力上限”转向“定义上限”——不知该教模型什么。
Anthropic与DeepMind治理模式对比：前者极度自上而下、执行力强；后者自下而上、工程管理扎实、预训练已进入舒适区。
AI研究“不太需要脑子”，更需要靠谱与细致，个人英雄主义时代已过去，成功依赖多人的可靠协作。
AI行业格局判断：OpenAI救了Google，自身陷入困境；AI安全主张幼稚；多数Neo Lab会死；除Agentic Coding外无真正原生场景。
技术预测6-12个月内AI将实现自主实验——闭环完成写代码、跑实验、分析、提出假设、设计新实验。
给年轻人建议：不必盲目服从权威，提高可靠性比追求天才更重要，纯语言模型已非蓝海。

内容结构：

一、"Claude写代码比GPT强，纯属歪打正着"：Claude 3的代码优势是自下而上的偶然尝试，Anthropic随后迅速将其升级为战略。Claude 3.7首次实现大规模强化学习，代码场景因反馈清晰和数据充分成为最原生应用。
二、"预训练没到头，撞墙的人大多是有bug"：作者认为Scaling Law并未触顶，Anthropic和Gemini持续进展，OpenAI近期有突破。真正困难在于“定义到头”——人类不知道如何用当前范式教会模型新能力。
三、Anthropic vs Google DeepMind：对比两机构决策模式、执行力、预训练/后训练状态。作者选择DeepMind而非OpenAI，理由是“踏实做事的人没有Gemini多”（原文表述可能有误，应为“踏实做事的人没有被足够重视”或类似，但原文是“觉得踏实做事的人没有Gemini多”，保留原意）。
四、"AI不太需要脑子"：AI研究大部分工作本科生即可完成，关键差异在可靠性与细致。效果评估易被hack，人应成为更可信的系统组件。对比物理领域有真正天才，AI更像18世纪物理学未分科。
五、"个人英雄主义已过去"：模型训练是数百人协作，个体贡献被稀释，世界在推着人前进。
六、对行业格局的犀利判断：OpenAI救了Google（未极致做chatbot让Google追上）；Anthropic安全想法幼稚；多数neo lab会死；AI产品仅Agentic Coding有原生场景，生存策略是逃得快或市场小。
七、技术预测：AI自己做实验：DeepMind当前方向包括ML Coding（AI训练AI）和Long Horizon。预测6-12个月内AI能自主实验。
八、给年轻人的建议：不必伺候权威，观点自洽即可赢得尊重；语言模型末班车已过。