
全球视野, 下注中国
打开APP
2025-09-10 13:00 星期三
07-22 06:17
阿里升级旗舰版Qwen3模型,性能超过Kimi-K2等领先闭源模型
格隆汇7月22日|据通义千问Qwen:今天,我们更新了旗舰版Qwen3模型,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A22B-Instruct-2507-FP8。
新的Qwen3模型,通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。
此外,本次更新的Qwen3模型,还增强了以下关键性能:
-在多语言的长尾知识覆盖方面,模型取得显著进步。
-在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。
-长文本提升到256K,上下文理解能力进一步增强。
目前,Qwen3新模型已在魔搭社区和HuggingFace上开源更新,欢迎开发者们体验。
US 阿里巴巴 HK 阿里巴巴-W
87.4w 阅读
07-22 05:22
媒体:软银和OpenAI的5000亿美元AI项目启动艰难
格隆汇7月22日|据华尔街日报,白宫早前宣布了一项5000亿美元星际之门的计划,旨在加强美国在人工智能领域的雄心,但该计划难以启动,近期计划也大幅缩减。知情人士透露,软银和OpenAI在合作的“星际之门”关键条款上存在分歧,其中包括选址问题。知情人士说,虽然两家公司在1月份的声明中承诺“立即”投资1000亿美元,但该项目现在设定了一个更为温和的目标,即在今年年底之前建立一个小型数据中心,地点可能在俄亥俄州。
70.3w 阅读
07-22 01:31
通义千问:更新旗舰版Qwen3模型 通用能力显著提升
格隆汇7月22日|通义千问:今天,我们更新了旗舰版Qwen3模型,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A22B-Instruct-2507-FP8。新的Qwen3模型,通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。
29.7w 阅读
阿波罗首席经济学家警告:AI热潮恐比1999年科网泡沫更严重
格隆汇7月21日|阿波罗全球管理公司(Apollo Global Management)在研究报告中指出,内部数据显示,标普500指数中市值最大的10家公司(其中许多是AI相关股票,如Meta与英伟达)的市盈率已经超越1999年科网泡沫高峰时的水平。这表明投资者的资金过度集中在少数科技巨头身上。
阿波罗全球管理公司首席经济学家Torsten Sløk表示,AI将为我们带来许多惊人的成就,但这是否意味着我应该在任何估值下都去买进科技股呢?答案是否定的。他指出,作为投资者,我投入100美元买进标普500指数,我以为自己分散投资在500家公司,但实际上我只是在押注英伟达与AI题材会持续下去。Sløk认为,大型科技股及整体指数的估值可能无以为继。
72.4w 阅读
07-21 15:00
图解|全球最强大的计算集群TOP20:xAI、Meta及微软占据领先地位
格隆汇7月21日|如今,人工智能的迅速崛起正引发新一轮算力的竞争。迄今为止,美国已占据领先地位,大型科技公司已投入数十亿美元用于人工智能基础设施建设,以确保竞争优势。
根据Epoch AI的数据,下图展示了全球领先的计算集群。xAI的Colossus Memphis第二阶段集群位居榜首,拥有20万个H100等价计算单元,是第二大集群的两倍。紧随其后的是Meta 的100K系统、微软/OpenAI的Goodyear集群以及甲骨文基于H200的 OCI Supercluster,GPU 数量在65,536到100,000之间。
US MetaPlatformsIncClassA US 微软 US 甲骨文
74.4w 阅读
07-21 10:13
Perplexity完成1亿美元新融资 估值达180亿美元
格隆汇7月21日|据英国《金融时报》,AI搜索引擎初创企业Perplexity完成了一次1亿美元的新融资,公司估值达180亿美元。据悉,Perplexity在今年3月就计划以180亿美元的估值展开融资,而后在投资者的压力下今年5月融资轮中的实际估值被降至140亿美元。
41.2w 阅读
07-19 18:01
AI赋能千行百业超级联赛在广西南宁启动
格隆汇7月19日|据央视,AI赋能千行百业超级联赛在广西南宁启动,本次大赛以“AI广西 AI中国 AI东盟”为主题,从7月持续至11月,吸引国内外头部企业、科研团队、高校学生及个人开发者参与,充分挖掘AI应用场景,重点培育面向东盟市场的人工智能新兴企业,推动人工智能技术与实体经济深度融合,促进人工智能转化为新质生产力,赋能千行百业。
66.6w 阅读
07-19 14:41
中国模型霸榜前三,Kimi K2登顶全球开源模型冠军
格隆汇7月19日|据全球大模型竞技场LMArena消息,开源模型与闭源模型的竞争进一步升级。在全球开源模型排行榜中,Kimi K2、DeepSeek R1、Qwen3等3个来自中国的开源模型排名前三,领先于谷歌Gemma3和Meta旗下Llama4,Kimi K2成为全球最强开源模型。该榜单由数千位开发者通过动态盲测进行投票。
93.6w 阅读
07-19 06:53
斯坦福开源复杂推理AI Agent,融合超10种工具
格隆汇7月19日|据AIGC开放社区,传统的AI助手通常依赖于单一模型或有限的工具集,难以应对需要多步推理、跨领域知识融合及高精度数据分析的任务。例如,解决视觉谜题,需要精细图像理解和基于文本的混合推理。为了解决这一难题,斯坦福开源了OctoTools,这是一个融合了11种不同工具专用于复杂推理的AI Agent。根据测试数据显示,Octotools在多领域的 16 项基准测试中,平均准确率非常高,可以轻松应对数学、科学、医学诊断等复杂场景任务。
99.6w 阅读
07-18 16:35
继OpenAI之后,Anthropic可望成全球第二家千亿级AI独角兽
格隆汇7月18日|据The Information,继OpenAI之后,人工智能领域的另一巨头Anthropic正迅速崛起,其估值有望突破1000亿美元大关,成为全球第二家估值达千亿美元的AI独角兽。这一里程碑式的进展,距离其上次宣布的580亿美元估值仅过去短短四个月。多位投资人正积极推动这笔巨额融资交易,而Anthropic旗下专为程序设计师打造的AI助手Claude Code正是此次估值飙升的关键驱动力。自今年5月推出Claude 4模型以来,Claude Code的表现惊艳:每周下载量暴增6倍,达到300万次;活跃用户规模成长300%;营收成长率更是超过5.5倍。Anthropic向投资人透露,Claude Code目前的年化收入已超过2亿美元,或每月贡献超过1670万美元的营收。
74.2w 阅读
07-18 12:04
特朗普将发布人工智能政策指南 料推动放宽监管及投资能源
格隆汇7月18日|美国总统唐纳德·特朗普预计将发布一项人工智能(AI)政策指南,主张放松监管、扩大数据中心的能源来源,并敦促国会考虑制定联邦立法,以在各州之前对这一新兴技术实施监管。继今年要求制定加快美国AI发展措施的全面框架之后,白宫政府预计将在未来几天内发布“人工智能行动计划”。届时特朗普预计将签署多项行政令,以实施该计划中概述的一部分政策。知情人士称,政策指南将侧重于传达政策立场,并仅限于行政部门的行动,而不是对人工智能的长期影响做出全面展望。
70.8w 阅读
07-18 09:12
据报Meta再挖走两名苹果关键AI研究人员
格隆汇7月18日|据彭博引述消息人士称,Meta再挖走两名苹果关键AI研究人员,Mark Lee及Tom Gunter加入Meta新成立超级人工智能实验室(Superintelligence Labs)。目前Meta行政总裁扎克柏格已将AI发展作为公司的首要任务,较早时苹果负责AI模型负责人庞若明(Ruoming Pang)已跳槽至Meta,传闻Meta开出的总酬金超过2亿美元。
US MetaPlatformsIncClassA US 苹果
44.3w 阅读
07-18 06:26
OpenAI发布ChatGPT Agent:能主动思考、自选工具,智能体赛道大变天
格隆汇7月18日|据AIGC开放社区,OpenAI通过技术直播发布重磅产品ChatGPT Agent。ChatGPT Agent具备自主思考和行动的能力,能够主动从其技能库中选择合适的工具,包括Operator、 Deep Research和ChatGPT来完成各种超复杂任务。
例如,用户可以要求ChatGPT Agent分析三个竞争对手并制作幻灯片演示文稿等请求。ChatGPT会智能地浏览网站、选择日期、筛选结果、运行代码,甚至自动生成经过润色的幻灯片演示文稿或电子表格。用户只需要一个提示,ChatGPT Agent就会完成所有工作。
253.8w 阅读