扫码阅读
手机扫码阅读

赶在发布前,深夜评测“讯飞星火认知大模型”

80 2025-05-03

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

查看原文:赶在发布前,深夜评测“讯飞星火认知大模型”
文章来源:
软件质量报道
扫码关注公众号
讯飞星火认知大模型体验摘要

讯飞星火认知大模型体验摘要

注册与使用体验

讯飞星火认知大模型虽未正式发布,但用户已可通过短信邀请体验。相比百度文心一言的漫长等待过程,讯飞的审核速度更为迅速高效,仅需几分钟即可完成注册并开始使用。

该模型继承了讯飞在语音识别与语音合成领域的技术优势,支持语音输入、语音播放与文本复制功能,使人机交流更自然流畅。

基础功能与表现

对于简单问题的回答,星火认知模型表现较圆滑,但尚未展现出突出的创新性。模型不具备直接画画能力,但能提供指导建议,其回答在不同尝试间存在一定差异。

代码能力测试

在代码能力测试中,星火认知模型的代码优化表现优于百度文心一言,但其写代码能力仍需提升。例如,在上下文相关问题中,无法生成完整且简单的代码类。

该模型能够理解并生成符合要求的产品需求文档(PRD)及典型用例分析,这比百度文心一言的输出质量更高。然而,在生成测试用例方面,其数量较少,且补充用例能力仍有待提高,与GPT-4存在差距。

测试设计方法与不足

对于使用测试设计方法生成测试用例的能力,星火认知模型在等价类划分、因果图方法和正交试验法的理解上表现不佳,仍主要依赖边界值分析。与GPT-4相比,其在测试用例生成数量与质量方面仍显不足。

尽管如此,模型在某些场景下仍带来了意料之外的惊喜,展现了潜在的优化可能性。

期待进一步表现

讯飞星火认知大模型的正式发布会将在今天下午2点举行,用户期待其带来更多惊喜与突破。

想要了解更多内容?

查看原文:赶在发布前,深夜评测“讯飞星火认知大模型”
文章来源:
软件质量报道
扫码关注公众号