扫码阅读
手机扫码阅读

ChatGPT多模态识图评测 - 传奇依旧

39 2024-09-29

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

查看原文:ChatGPT多模态识图评测 - 传奇依旧
文章来源:
数字生命卡兹克
扫码关注公众号

自2023年3月GPT-4发布以来,多模态能力的加入被广泛期待,该功能支持图片识别和图片+文字的结合,提供了新的互动可能性。9月25日,OpenAI正式宣布将在两周内推出识图功能,让多模态功能得以面世。

虽然作者本人没有直接的使用权限,但通过借用他人账号体验了GPT-4的多模态功能,并分享了一些有趣的案例,来展现其潜力:

  • 个人医生助理:多模态GPT-4可以作为医生助理,提供初步的医疗分析和建议,尽管不能完全替代专业医师,但在家庭医疗方面有巨大潜力。
  • 教育助理:该技术能够根据学生的不同水平提供个性化的学习支持,OpenAI已成立教育研究院,展现了教育行业与AI结合的前景。
  • 健身助理:GPT-4能通过图片计算食物的卡路里,并提供健身动作的反馈。
  • 摄影助理:多模态GPT-4可以对照片进行评分、优化构图,并提供滤镜参数。
  • 开发助理:通过草图来生成网页或游戏,大大简化了开发过程。
  • 解码文件:有用户使用GPT-4V解码了政府编辑过的UFO目击文件,标志着新时代的到来。

作者认为,多模态和通用AGI是AI未来发展的关键方向。随着GPT-4V的发布,这个新时代已经开始,将会带来知识与技术的巨大进步。最后,作者鼓励大家保持好奇心,一起拥抱即将到来的技术革命。

文章的最后,作者邀请读者对文章做出反馈,如点赞、评论和转发,并希望获得星标支持。

想要了解更多内容?

查看原文:ChatGPT多模态识图评测 - 传奇依旧
文章来源:
数字生命卡兹克
扫码关注公众号