扫码阅读
手机扫码阅读
ChatGPT多模态识图评测 - 传奇依旧
39 2024-09-29
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
文章来源:
数字生命卡兹克
扫码关注公众号
自2023年3月GPT-4发布以来,多模态能力的加入被广泛期待,该功能支持图片识别和图片+文字的结合,提供了新的互动可能性。9月25日,OpenAI正式宣布将在两周内推出识图功能,让多模态功能得以面世。
虽然作者本人没有直接的使用权限,但通过借用他人账号体验了GPT-4的多模态功能,并分享了一些有趣的案例,来展现其潜力:
- 个人医生助理:多模态GPT-4可以作为医生助理,提供初步的医疗分析和建议,尽管不能完全替代专业医师,但在家庭医疗方面有巨大潜力。
- 教育助理:该技术能够根据学生的不同水平提供个性化的学习支持,OpenAI已成立教育研究院,展现了教育行业与AI结合的前景。
- 健身助理:GPT-4能通过图片计算食物的卡路里,并提供健身动作的反馈。
- 摄影助理:多模态GPT-4可以对照片进行评分、优化构图,并提供滤镜参数。
- 开发助理:通过草图来生成网页或游戏,大大简化了开发过程。
- 解码文件:有用户使用GPT-4V解码了政府编辑过的UFO目击文件,标志着新时代的到来。
作者认为,多模态和通用AGI是AI未来发展的关键方向。随着GPT-4V的发布,这个新时代已经开始,将会带来知识与技术的巨大进步。最后,作者鼓励大家保持好奇心,一起拥抱即将到来的技术革命。
文章的最后,作者邀请读者对文章做出反馈,如点赞、评论和转发,并希望获得星标支持。
想要了解更多内容?
文章来源:
数字生命卡兹克
扫码关注公众号
数字生命卡兹克的其他文章
加入社区微信群
与行业大咖零距离交流学习
软件研发质量管理体系建设
白皮书上线