赶在发布前,深夜评测“讯飞星火认知大模型”

发布于 2025-05-03
972

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

扫码阅读
手机扫码阅读
讯飞星火认知大模型体验摘要

讯飞星火认知大模型体验摘要

注册与使用体验

讯飞星火认知大模型虽未正式发布,但用户已可通过短信邀请体验。相比百度文心一言的漫长等待过程,讯飞的审核速度更为迅速高效,仅需几分钟即可完成注册并开始使用。

该模型继承了讯飞在语音识别与语音合成领域的技术优势,支持语音输入、语音播放与文本复制功能,使人机交流更自然流畅。

基础功能与表现

对于简单问题的回答,星火认知模型表现较圆滑,但尚未展现出突出的创新性。模型不具备直接画画能力,但能提供指导建议,其回答在不同尝试间存在一定差异。

代码能力测试

在代码能力测试中,星火认知模型的代码优化表现优于百度文心一言,但其写代码能力仍需提升。例如,在上下文相关问题中,无法生成完整且简单的代码类。

该模型能够理解并生成符合要求的产品需求文档(PRD)及典型用例分析,这比百度文心一言的输出质量更高。然而,在生成测试用例方面,其数量较少,且补充用例能力仍有待提高,与GPT-4存在差距。

测试设计方法与不足

对于使用测试设计方法生成测试用例的能力,星火认知模型在等价类划分、因果图方法和正交试验法的理解上表现不佳,仍主要依赖边界值分析。与GPT-4相比,其在测试用例生成数量与质量方面仍显不足。

尽管如此,模型在某些场景下仍带来了意料之外的惊喜,展现了潜在的优化可能性。

期待进一步表现

讯飞星火认知大模型的正式发布会将在今天下午2点举行,用户期待其带来更多惊喜与突破。

软件质量报道

本公众号致力于健康、安全、绿色的软件生态,分享软件质量管理、软件测试的思想、方法、技术与优秀实践,追踪软件质量领域的热点,及时报道软件质量管理的成功案例或质量事故,以及分享深度思考、有温度的技术文章等,努力成为您工作中的朋友。

45 篇文章
浏览 61.3K

还在用多套工具管项目?

一个平台搞定产品、项目、质量与效能,告别整合之苦,实现全流程闭环。

加入社区微信群
与行业大咖零距离交流学习
PMO实践白皮书
白皮书上线