Claude Opus 4.8 发布，模型迭代越来越快，AI产品经理到底该看什么？

模型 AI 这次 Claude 」，

发布于 2026-06-26

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：Claude Opus 4.8 发布，模型迭代越来越快，AI产品经理到底该看什么？

文章来源：

产品经理四月

扫码关注公众号

扫码阅读

手机扫码阅读

文章主旨：Claude Opus 4.8 的更新标志着大模型正从“会说”转向“会做”，AI 产品经理应关注模型能力边界而非跑分，亲自用真实业务测试以提升模型选型能力。

关键要点：

Claude Opus 4.8 在“诚实”“不偷懒”方面大幅优化，降低蒙混过关概率至上一代的约1/4。
模型能力重心从聊天、写作等“说”的任务，转向稳定执行具体任务的“做”的阶段。
动态工作流（Dynamic Workflows）让模型能自主拆解大任务，并行调用大量子助手并自验结果。
工作流仍具价值，但应以模型自主设计的方式存在，而非手动拖拽搭建。
AI 产品经理不应盲目信任榜单，需用公司真实业务场景亲自测试模型，培养模型选型判断力。

内容结构：

01 模型开始「不偷懒」
原文指出以往大模型常出现“嘴上说完成，实际未完成”的问题。Opus 4.8 重点优化此点，在代码任务中蒙混过关的概率降低约75%。作者同时表达了对 Opus 4.6 被下架的遗憾。

02 AI 正在从「会说」走向「会做」
早期模型侧重“说”（聊天、写文案），当前模型比拼“做”（稳定从头执行任务）。Opus 4.8 的“动态工作流”允许模型自行拆分大型任务，拉起数十至上百个子助手并行工作，并自验后再交付结果。原文强调，在公司业务中，工作流仍是保证稳定、确定和效率的关键，但其形式变为模型自主设计工作流，而非手动搭建。这对产品设计的启发是：不让产品停留在对话框，要让 AI 真正帮用户完成具体工作。

03 作为 AI 产品经理，到底该怎么看待这种更新？
作者给出三条建议：第一，关注顶级模型的更新方向，重点看“能力边界”而非分数；第二，不要只信任榜单，业评测与实际业务有距离；第三，必须用公司真实业务问题亲自测试模型，以获得真实体感。这种判断力（模型选型）是 AI 产品经理最具价值的能力之一。最终结论：跑分不重要，重要的是 AI 越来越能干活；产品经理应锻炼“上手测、做判断”的能力。

文章总结：本文以 Claude Opus 4.8 更新为例，阐明大模型实用化方向，提示从业者跳出跑分焦虑，以真实业务测试驱动模型选型和产品设计。