最近一周堪比AI圈春晚!

模型 生成 https 开源 Agent
发布于 2026-06-13
3

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

扫码阅读
手机扫码阅读

文章主旨:

近期AI领域各大公司密集发布多项重磅模型与产品升级,涵盖基础模型、编程工具、图像生成及3D建模等方向,竞争格局加速演变。

关键要点:

  1. DeepSeek-V4、GPT-5.5、Qwen3.6-27B、Kimi K2.6等模型在上下文长度、推理能力、编程性能上实现显著突破。
  2. OpenAI与英伟达联合发布GPT-5.5,其生成速度与效率提升,在编程和数学基准上表现突出。
  3. 阿里、腾讯、字节跳动等国内厂商在开源、多模态、3D建模等领域发布重要更新,展现研发实力。
  4. 马斯克旗下SpaceX拟600亿美元收购AI编程独角兽Cursor,意在补齐xAI在编程领域的短板。
  5. 蚂蚁百灵推出Ling-2.6-flash,以极小激活参数实现高推理速度,强调“智效比”。

内容结构:

DeepSeek-V4 预览版发布
DeepSeek推出V4系列,含Pro和Flash版本,支持100万Token上下文。Pro版1.6万亿总参数(激活490亿),在知识、推理、Agent能力上比肩顶尖闭源模型,数学与代码竞赛突出;Flash版以更小参数提供高性价比推理。模型已开源并上线API。

联合英伟达,OpenAI发布GPT-5.5
GPT-5.5由OpenAI与英伟达联合设计,深度适配GB200/GB300 NVL72系统。该模型在真实生产中延迟持平GPT-5.4,生成速度提升超20%,上下文窗口400K。编程Terminal-Bench 2.0得82.7%,超越GPT-5.4(75.1%)和Claude Opus 4.7(69.4%);数学FrontierMath Tier 4达39.6%;知识工作GDPval达84.9%。已集成至Codex,支持全流程自动化。

阿里开源Qwen3.6-27B稠密模型
Qwen3.6-27B是270亿参数的稠密多模态模型,支持思考与非思考模式。在智能体编程基准上超越前代开源旗舰Qwen3.5-397B-A17B,SWE-bench Verified 77.2分,Terminal-Bench 2.0表现旗舰级,GPQA Diamond 87.8分。已开源权重,支持本地部署,将集成至阿里云百炼平台。

字节跳动Seed3D 2.0重磅升级
Seed3D 2.0通过架构革新在几何精度与纹理材质上取得SOTA。几何生成引入Coarse-to-Fine两阶段策略,结合局部感知先验与体素化位置编码,解决锐利边缘与薄壁结构;纹理生成采用统一PBR架构及MoE提升细节,VLM先验增强材质分解稳定性。盲评中几何生成偏好率显著优于Hunyuan3D、Tripo,纹理生成偏好率超69%。支持部件级生成、关节化建模及场景组合。

腾讯混元发布Hy3 preview
Hy3 preview采用快慢思考融合的混合专家架构,2950亿总参数,激活210亿,支持256K上下文。在复杂推理、代码生成及Agent任务上大幅提升,可自然语言生成微信小程序代码、制作PPT等。已接入腾讯元宝、CodeBuddy、WorkBuddy等内部工具及腾讯文档、QQ浏览器等C端产品,已开源权重。

OpenAI 发布 ChatGPT Images 2.0
ChatGPT Images 2.0具备“思考”能力,生成前推理规划、联网获取信息并自我复核。文本渲染(尤其是中、日、韩等多语言)大幅提升,支持3:1到1:3宽高比及最高2K分辨率,可一次生成多张角色风格一致的连续图像。已集成至ChatGPT、Codex及API。

马斯克拟600亿美元收购Cursor
SpaceX拟以600亿美元收购AI编程独角兽Cursor,或支付100亿美元合作费。Cursor由4位00后MIT学生创立,估值约500亿美元。收购原因在于马斯克认为xAI编程落后,且xAI经历重组与人员流失;Cursor计划使用xAI的数万个GPU训练Composer 2.5。

Kimi K2.6 发布并开源
Kimi K2.6在代码、长程任务及Agent集群能力上突破。在Humanity's Last Exam、SWE-Bench Pro等基准中持平或优于GPT-5.4和Claude Opus 4.6,可不间断编码13小时处理超4000行代码。Agent集群支持最多300个子Agent并行完成4000个协作步骤,支持持续自主运行5天。已上线kimi.com、Kimi应用、Kimi API及Kimi Code。

代号为 Elephant Alpha 的匿名模型被揭晓
匿名模型为蚂蚁百灵Ling-2.6-flash,104B总参数、激活7.4B的MoE Instruct模型,采用混合线性注意力机制。4卡H20下推理速度340 tokens/s,Prefill吞吐为Nemotron-3-Super的2.2倍;Artificial Analysis评测中26分Intelligence Index仅消耗15M tokens,约为竞品1/10。在BFCL-V4、SWE-bench Verified等Agent基准达同尺寸SOTA,支持256k上下文,已开放API,计划开源BF16、FP8、INT4版本。

文章总结:

AI行业进入高密度发布期,多模态、编程能力、Agent效率成为竞争焦点,开源与商业化并行推进,模型性能与推理成本同步优化。

啥都会一点的研究生