新华社最新AI报告:大模型概念红利逐渐消失,需关注大模型+行业

3 年前14.5k
文|开叔近日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告 2.0》,其中提到,大模型概念红利逐渐消失,正回归到实际应用。报告针对大模型给出发展建议,并对未来发展趋势进行解读。另外报告评测了国内8个大模型产品,包括科大讯飞

|开叔

近日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告 2.0》,其中提到,大模型概念红利逐渐消失,正回归到实际应用。

报告针对大模型给出发展建议,并对未来发展趋势进行解读。另外报告评测了国内8个大模型产品,包括科大讯飞、文心一言、360智脑等。

发展趋势及建议

报告指出,AI技术发展的重点已经不再是盲目追求大模型,而是转向实用性和可持续性的发展。越来越多的企业和学术界开始关注如何将大模型与实际应用场景相结合,实现真正的商业化应用。

建议通过降低成本、提高易用性,以及通过安全可解释、提升数据安全等措施,以提高大模型的可用性。

随着大模型概念红利逐渐消失,应在未来持续加强算力基础设施建设,跨领域知识、多模态数据融合,深耕安全可靠的大模型产品应用,让大模型走向实体经济,注重大模型的在线学习和增量学习。

大模型评测

新华社研究院中国企业发展研究中心曾在6月发布《人工智能大模型体验报告》,此次对评测进行了升级,主要引入Benchmark-人类答案做对比,更加直观观测A模型与人之间的差异。

另外,题目数量由300道扩充到500道,根据目前市场情况,增加二级分类权重,并细化二级分类,侧重考察产品的基础能力和智商部分等。

在具体的评测维度方面,包含:基础能力、智商测试、情商测试、工具提效能力。

本次评测产品共8个,排名为:讯飞星火、文心一言、商量、ChatGLM、360智脑、天工、通义千问、Mchat。

在各项具体能力方面,文心一言的基础能力十分突出;星火、ChatGLM的智商指数同样优秀;商量的情商指数有明显优势;星火的工具提效指数一骑绝尘。

而各项能力与人类的对比方面,人类与AI之间的基础能力差距并不显著,此外,人类在智商、情商方面明显优于AI,但AI的工具效率远超人类。

最后

此次新华社发布的报告2.0,指出了国内AI大模型未来发展的方向,其中的重点是大模型的实际应用,未来,大模型+行业的发展将愈发重要。

但在产品评测上,所选取的大模型数量有限,加之没有更多评测细节的展示,所以对于用户来说,还需要通过自己的亲身体验来感受各个大模型的优劣,并作出自己的评判。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

App内直接打开
商务、渠道、广告合作/招聘立即咨询

相关文章

2026年薄荷脑行业现状和前景报告:规模、份额及增长率

贝哲斯咨询 · 58分钟前

cover_pic

2026年磷酸三甲苯酯行业增长分析及主要企业市场份额调研报告

贝哲斯咨询 · 59分钟前

cover_pic

黄芪提取物行业国内市场消费数据分析与未来前景预测报告

贝哲斯咨询 · 59分钟前

cover_pic
我也说两句