11:29
Kimi K2 Thinking在多项推理测试中均超过GPT-5
格隆汇11月8日|GPT-5和Claude Sonnet 4.5 Thinking仍然是领先的思考模型。然而,在相同的基准测试中,Kimi K2 Thinking的代理推理得分超过了两者:例如,在BrowseComp测试中,K2 Thinking以60.2%的分数绝对领先GPT-5的54.9%和Claude的24.1%。K2 Thinking在GPQA Diamond测试中也以85.7%的分数超过了GPT-5的84.5%,在AIME 2025和HMMT 2025等数学推理任务上也与GPT-5不相上下。

2025-11-082503.9k

商务、渠道、广告合作/招聘立即咨询

相关文章

日经225大涨超3%,首破65000点再创新高!

小摩根 · 3小时前

cover_pic

华为发表半导体演进新定律!

默德君 · 1小时前

cover_pic

特朗普炒股,吃相有多难看?

独行侠 · 昨天 20:20

cover_pic