Kimi K2 Thinking在多项推理测试中均超过GPT-5

全球视野, 下注中国

打开APP

11:29

格隆汇11月8日｜GPT-5和Claude Sonnet 4.5 Thinking仍然是领先的思考模型。然而，在相同的基准测试中，Kimi K2 Thinking的代理推理得分超过了两者：例如，在BrowseComp测试中，K2 Thinking以60.2%的分数绝对领先GPT-5的54.9%和Claude的24.1%。K2 Thinking在GPQA Diamond测试中也以85.7%的分数超过了GPT-5的84.5%，在AIME 2025和HMMT 2025等数学推理任务上也与GPT-5不相上下。

2025-11-082504.0k

商务、渠道、广告合作/招聘立即咨询

相关文章

37次临停，8次熔断！韩股到底有多魔幻！

长鑫科技，中签率公布！

事关安世半导体、氦气出口，商务部最新回应！