商汤开源发布新架构NEO！

模型视频推理 https V3.2

发布于 2026-06-11

282

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：商汤开源发布新架构NEO！

文章来源：

啥都会一点的研究生

扫码关注公众号

扫码阅读

手机扫码阅读

文章主旨：

本周AI科技圈发布了多项重要更新，涵盖大模型、芯片、视频生成、语音识别等领域，展现了技术创新的最新进展。

关键要点：

亚马逊AWS推出十大AI更新，包括新一代自研芯片、开源模型扩展及智能体服务优化。
商汤科技发布NEO原生多模态架构，创新性地融合视觉与语言能力，性能媲美旗舰模型。
DeepSeek发布V3.2及增强版Speciale，显著提升数学推理与智能体能力，达到国际竞赛级水平。
Mistral AI推出Mistral 3系列模型，涵盖边缘端与开源大模型，强调性价比与多语言能力。
火山引擎发布多项AI模型，包括豆包语音识别2.0与图像创作模型Seedream 4.5，提升复杂场景应用精度。

内容结构：

1. 亚马逊AWS的AI领域重大更新

亚马逊在re:Invent大会上发布Trainium4芯片，Nova 2系列大模型，以及Bedrock平台扩展和智能体服务。重点提升了FP性能、能效比、开源模型选择及企业定制服务能力。

2. 商汤科技NEO架构创新

商汤联合南洋理工大学推出NEO架构，摒弃传统模块化设计，通过底层创新实现视觉与语言深度融合，性能媲美同类旗舰模型，并已开源部分规格。

3. DeepSeek V3.2更新与Speciale版本

DeepSeek发布V3.2及Speciale版本，显著提升数学推理与智能体评估性能，在国际竞赛中达优秀水平，同时优化计算开销与长思考模式。

4. Mistral AI新品发布

推出Mistral 3系列模型，包括边缘端模型与开源MoE模型，强调性价比与广泛的多语言支持，适合多场景部署。

5. 火山引擎与字节新模型

火山引擎发布豆包语音识别2.0和Seedream 4.5图像创作模型，均在复杂场景应用中表现出高精度与创新性。字节跳动推出视频生成模型Vidi2，提升视频理解与生成效果。

6. 英伟达、谷歌与其他更新

英伟达发布具备因果推理能力的视觉-语言-行动模型Alpamayo-R1，优化自动驾驶决策。谷歌公测Gemini 3 Deep Think模式，适用于复杂科学与数学任务。Runway推出Gen-4.5视频生成模型，树立新的运动质量与视觉表现标准。

文章总结：

本周AI科技领域发布的创新技术展现了行业的快速发展，从算法优化到硬件升级，未来趋势值得持续关注。

啥都会一点的研究生

查看原文：商汤开源发布新架构NEO！

文章来源：

啥都会一点的研究生

扫码关注公众号

相关推荐

极佳、中科院等9机构联合首发 | 3万字长文全面解析世界模型(内容生成/自动驾驶等)

1807

模型世界生成视频

击下方卡片，关注“AI生成未来”>>后台回复“GAI

大语言模型的前世今生：万字长文完整梳理所有里程碑式大语言模型（LLMs）

2174

模型训练语言 GPT

点击下方卡片，关注“AI生成未来”>>后台回复“

理解 DDD：编程中的模型思维

1555

模型业务计算机逻辑

业务设计上往往没有建立起特定的领域模型，这是我们架构腐化和软件开发困难的关键原因。**业务领域建立好的模型，并指导代码实践，这就是 ”编程思维“。** DDD 领域驱动设计就是解决这部分问题，与其叫领域驱动设计，不如叫做模型驱动设计。

具身智能成败之关键！干货长文首次全面回顾具身智能领域中的视觉-语言-动作模型！

1886

模型语言视觉机器人

点击下方卡片，关注“AI生成未来”>>后台回复“

超越CogVideoX-5B、Pika、Kling 和 Gen-3！苹果再发新作，视频生成大模型全面报告

1640

模型视频生成图像

点击下方卡片，关注“AI生成未来”后台回复“GAI”??

大模型推理必看！2025最值得读的14篇论文和2篇博客

1304

模型推理论文 LLM

Datawhale干货作者：曾浩龙，Datawhale团队大模型的

啥都会一点的研究生

啥都会一点，啥都不精通，自动驾驶感知算法工程师

74 篇文章

浏览 92.1K

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

查看方案

啥都会一点的研究生的其他文章

中国AI大模型市场迎来新格局！

AI圈最近又发生了啥新鲜事？

舒服了，并不是所有Python核心开发者都写类型注解

许多教程或Python官方的编码风格约定中都会提及类型注解这个东西Python：求求按规范写我就我个人而言，

软件开发中高频专业名词汇总！防止有人不说人话

A • Acceptance Testing：在客户端进行的测试 • Adapti

推介几个我装机必备的实用终端工具

效率嘎嘎提升

十年很短，编程很难

前几天冲浪看到的一篇文章，深有感触，翻译给大家一起看看吧许多年前，当我仍是一名主修计算机科学的高年级学生时，

随机阅读

作为一名敏捷教练的自我修养 - 手绘Scrum框架

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询

商汤开源发布新架构NEO！

版权声明

文章主旨：

关键要点：

内容结构：

1. 亚马逊AWS的AI领域重大更新

2. 商汤科技NEO架构创新

3. DeepSeek V3.2更新与Speciale版本

4. Mistral AI新品发布

5. 火山引擎与字节新模型

6. 英伟达、谷歌与其他更新

文章总结：

迭代失败的4个迹象，团队中了几个？快来看看如何解决！

还在用多套工具管项目？

联系我们

融实践库

微信公众号

微信视频号

社区微信群