12:05
MiniMax宣布开源面向Coding Agent的新评测集
格隆汇1月14日|MiniMax宣布开源面向Coding Agent的新评测集OctoCodingBench。MiniMax表示,基于该评测集,其针对现有的开源闭源模型进行了广泛的评估,并发现一些很有启发性的实验结果:所有模型的Check-level 准确率(CSR)可以达到80%+,但Instance-level成功率(ISR)只有10%-30%;绝大模型模型的指令遵循能力会随着轮次的变多逐渐下降;现阶段模型表现普遍未能达到生产级要求,过程合规仍是盲区;开源模型正在快速追赶闭源模型。
相关股票

HK MINIMAX-WP

2026-01-14520.8k

商务、渠道、广告合作/招聘立即咨询

相关文章

亚太股市狂欢,日股暴拉3400点再创新高!

白野橘 · 6小时前

cover_pic

巨头重磅引爆,A股又站在“光”里!

林春木 · 5小时前

cover_pic

央行连续18个月增持黄金!

华一席 · 1小时前

cover_pic