扫码阅读

手机扫码阅读

聊聊大模型的幻觉问题

1714 2024-01-30

模型训练 AI

鼎叔在这篇原创文章中聚焦于当前AI领域的火热议题——大模型AI实践，特别是它们产生的幻觉问题。文章强调，尽管幻觉问题在大模型中不可避免，但同时也体现了模型的创造力。此外，鼎叔提出了多种策略来降低这些幻觉的发生。

大模型的幻觉问题，即Hallucination，指模型基于有限元素和强大的语言表达能力生成逻辑上似乎合理但实际不符合已知常识的描述。幻觉可能由错误数据、训练过程失误、推理错误等多种原因触发。尽管闭源模型因用户反馈而幻觉较少，幻觉本身是大模型创造力的一部分，为人类提供了探索各种可能性的“梦工厂”。

针对幻觉问题，鼎叔建议采取多种解决方案，如使用不同来源的语料库进行训练、结合检索和生成模型、手动标注和修订数据集、优化提示工程、改进编解码器、严格数据比对、引入常识规则、收集跨模态幻觉案例、保留原始训练数据、训练模型承认不确定性、完善预训练策略、以及使用其他大模型进行置信度评分。

同时，鼎叔认为大模型幻觉与安全息息相关，预见黑产可能利用幻觉进行舆论操纵或攻击，这一新方向值得进一步探究。最后，他预告将探讨大模型在业务创新、研发效能、测试领域的应用，以及测试工程师的适应技能。

想要了解更多，点击查看原文

相关推荐

AIGC｜万字长文！带你了解AI大模型技术演进

1034

模型神经网络 AI

大模型时代来临，我们站上了风口浪尖→

2024 年数据管理在人工智能中的四大趋势

数据模型人工智能数据集

在 2023 年即将结束之际，我们会发现随着 ChatGPT 的引

AIGC｜AGI远不止ChatGPT！一文入门AGI通识及应用开发

582

模型数据 AI 向量

AGI时代已经到来，如何才能赶上浪潮？

重视模型输出 - 解析流程架构咨询 PPT 输出和模型输出的差异，以及为何需要做模型输出？

270

模型流程输出架构

在有些流程架构咨询项目中，PPT 输出成为常见且主要的沟通工具，但忽视了模型输出的潜在价值。我将在这篇文章中与帮友们探讨 PPT 和模型输出的差异，阐述为何需要重视模型输出？并为咨询师提供转化经验和指南。

自建还是采用外部数据模型的策略

数据模型行业数据模型

。

原创 | GPT模型的前世今生

GPT 模型文本生成

本文为你介绍GPT模型的前世今生。

敏捷测试转型

《无测试组织-测试团队的敏捷转型》主题探讨。从打造测试的组织敏捷，到敏捷测试技术的丰富实践，从一线团队的视角来聊聊我们是怎么做的。面向未来，拥抱敏捷原则，走向高效能组织。

81 篇文章

浏览 26.6K

敏捷测试转型的其他文章

聊聊机器的情感和意识

人工智能的“思考”，和人类大脑的思维原理高度相似，我们从大脑精神活动的6个层次的剖析，可以领会到机器是如何产生意识的。

聊聊用户故事地图

主要的用户故事场景，就是测试应优先关注的覆盖场景。本文就聊聊用户故事场景的脑爆梳理方法：用户故事地图

聊聊每日站会

每日站会是一线敏捷团队自己的会议，快速同步成员为达成迭代目标所做出的贡献，并对有风险的阻碍采取行动。如果测试人员所在的项目团队没有组织每日站会，一线测试团队也可以自行组织站会，用很少的时间高效沟通，受益良多

聊聊刻意练习-构建心理表征

社会上经常出现的两类观念，一个是天才和大师有着常人没有的巨大天赋，一个是只要“刻意练习”一万个小时以上就能成为大师，这两种说法都容易误导人。天才并不存在，盲目训练也可能适得其反，但高效且正确的长期训练可以让普通人在任何方面成为大师

聊聊NPS-提升用户体验的终极问题

提升用户体验，是每个产品技术及品质团队孜孜以求的目标，背后涉足的科学和实践知识博大精深。这篇文章先展开聊聊关于它的终极指标-NPS，以及企业是如何通过优秀实践提升NPS的

随机阅读

加入社区微信群

与行业大咖零距离交流学习

软件研发质量管理体系建设白皮书上线

去下载

联系我们
电话：4006 8899 23 邮箱：beining@easycorp.ltd
融实践库
关于我们加入我们
微信号：xdwjack
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询

聊聊大模型的幻觉问题

联系我们

融实践库

微信公众号

微信视频号

社区微信群