扫码阅读
手机扫码阅读

AI又进化了

45 2024-09-29

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

查看原文:AI又进化了
文章来源:
啥都会一点的研究生
扫码关注公众号
AI领域前沿动态摘要

谷歌Chrome AI 功能“Help me write”

谷歌在Chrome浏览器推出了“Help me write”的AI功能,由Gemma支持,旨在帮助用户编写或完善文本,特别是短格式内容。该工具可以理解网页上下文,引入相关信息至写作建议中。

原文链接

LongRoPE:扩展LLM上下文窗口

微软提出的LongRoPE技术,将预训练大型语言模型(LLMs)的上下文窗口扩展到2048k tokens,解决了扩展上下文窗口的多个问题,并保留了原始架构的同时进行了轻微修改和优化。

原文链接

Stable Diffusion 3:新一代文生图模型

Stability.AI 宣布了Stable Diffusion 3,一款文生图模型,提高了在多主题提示、图像质量和拼写能力方面的性能,引起了AI社区的广泛关注。

原文链接

AnyGPT:迈向通用AI的进步

上海团队研发的AnyGPT,能理解和生成包括文本、语音、图像和音乐在内的多种数据模式,是迈向通用人工智能的重要一步。

原文链接

Google 发布开源LLM Gemma

谷歌开源了Gemma语言模型,以及发布了“负责任的生成式人工智能工具包”,帮助开发安全的AI应用程序,并提供在多个平台使用的激励措施。

原文链接

Meta 发布Aria录音数据集

Meta发布了Aria智能眼镜的多模式数据集,包括音频、视频、运动传感器和标注,推动语音识别和增强现实界面翻译领域的研究。

原文链接

Adobe 发布新AI助手

Adobe在Acrobat软件中推出了AI助手,帮助用户浏览文档,并成立了CAVA研究团队,专注于生成式视频和音频创作工具的开发。

原文链接

Groq 的AI芯片助力LLM

Groq开发的AI硬件,有史以来第一个语言处理单元(LPU),为LLM提供比ChatGPT更高的处理能力,成为实时AI应用的理想选择。

原文链接

谷歌开源AI文件类型识别器Magika

谷歌开源了AI文件类型识别系统Magika,提供高效准确的文件检测,增强了用户的安全性。

原文链接

NVIDIA新数据集提升LLMs数学能力

英伟达发布了OpenMathInstruct-1数据集,提高了LLMs的数学指令调整能力,推动了数学推理能力的发展。

原文链接

想要了解更多内容?

查看原文:AI又进化了
文章来源:
啥都会一点的研究生
扫码关注公众号