22:13
OpenAI研发出新方案,可将推理成本减半
格隆汇6月30日|据一位知晓相关讨论的知情人士透露,有一则此前从未对外披露的消息:本月早些时候,OpenAI 工程师向部分同事表示,依托几项全新研发的优化技术,他们找到了一套方案,能将模型推理成本削减一半以上。工程师将这套新技术应用于无免费 / 付费账号访客使用 ChatGPT 的场景后,一度把所需英伟达图形处理器(GPU)数量压至仅数百块 —— 这一数字低得令人震惊。目前外界尚不清楚 OpenAI 实现此番算力效率大幅提升的具体技术手段,业内常用优化方案大致包括:量化压缩、键值缓存、批量处理用户查询而非逐条单独运算,以及将部分请求分流至功耗更低的轻量化模型或模型分片进行应答。

2026-06-30324.0k

商务、渠道、广告合作/招聘立即咨询

相关文章

工信部等八部门:到2030年建设5万张工业5G专网

华一席 · 昨天 18:47

cover_pic

日元40年新低,干预箭在弦上?

林春木 · 昨天 15:47

cover_pic

最隐秘的AI赢家

弗雷迪 · 昨天 19:48

cover_pic

科技横扫全球!上半年A股火热收官,港股独陷逆风

茶山 · 昨天 23:43

cover_pic