AI聊天正在终结?

原创7 小时前27.4k
准备好了吗

本文作者 |  远禾

数据支持 | 勾股大数据(www.gogudata.com)

用户熟悉的那个ChatGPT正在走入消亡。

最近,十多位OpenAI现任和前任员工集体爆料——

ChatGPT即将迎来2022年上线以来最大规模的改版。

再过几周,那个我们熟悉的对话框,将被彻底抹去。

取而代之的,是编程工具、图片生成入口、CanvaBooking.com,以及一连串第三方合作伙伴的服务,直接嵌入页面。

ChatGPT不再能ChatAI究竟会成为什么?


01


时至今日,ChatGPT仍是全球最成功的应用之一。

前不久,它刚刚创下全世界月活最快从破亿到10亿的纪录,用户量一度超过全球绝大多数互联网应用。

然而仅仅几天之后,ChatGPT就这么轻而易举地被彻底改写了。

OpenAI核心产品负责人Thibault Sottiaux对于ChatGPT的转型表示,OpenAI要做的东西将超越现有的界面形态。

ChatGPT会成为一个真正的个人Agent,在生活和工作的每一个角落帮助你——手机上、电脑里、浏览器中,甚至在车里,你都能直接和它对话,只是,不再是以聊天的方式。

这背后的原因很简单——仅靠聊天,撑不起一家万亿公司的估值。

2026年第一季度,美国企业级AI市场的份额排位悄然逆转。

Anthropic首次超越OpenAIClaude成为了行业的新领跑者。

紧接着在5月底,Anthropic又完成了650亿美元的新融资,估值冲上9650亿美元,一举超越OpenAI在今年2月公布的8520亿美元估值。

不久前,Anthropic更是秘密递交了注册声明,抢先OpenAI一步,启动了上市程序。

四面受敌的压力之下,OpenAI必须拿出更大的动作来回应。

于是,他们的答案就是,ChatGPT从一个会聊天的机器人,改造成一个能工作的智能工作台,也即是AI Agent

回看过去两年,绝大多数人使用AI的方式,本质上还停留在问答这一层。

用户提一个问题,AI解决一个问题;再提一个,调整下提示词,AI再回答一遍。

但现在这个模式已经逼近天花板。

数据显示,20264月,Chatbot榜单前20名中,有9个产品的网站访问量出现了下滑。

其中,ChatGPT仍以5.69亿月访问量占据第一,可环比已经跌去3.84%

与此同时,Claude的访问量却暴涨了34.18%

原因就在于,Claude不再只是回答问题,而是正在主动完成人的工作。

20264Chatbot排名 图源:AICPB

所以,与其说是OpenAI主动拥抱了Agent,不如说是被市场、被竞争、被不进则退的恐惧,一步一步逼到了这一步。

眼下,AI Agent已成为整个行业心照不宣的共识。

Claude Code的多Agent并行指挥,到GoogleI/O上强化Agent战略,再到OpenAICodex移动端和Workspace Agents——各大AI厂商几乎集体从Chatbot切换到了Agent的研发轨道上

这股浪潮同样席卷了国内,腾讯推出了WorkBuddy,百度发布了RedClaw,阿里旗下千问大模型直接用红包拉新的方式打通外卖、电商移动端入口。

Agent已经变成了所有主要AI玩家的共同方向,也成为了残酷的斗兽场。

对于OpenAI来说,要做超级应用,不只是在整合功能,还是在同步抢夺分发权。

相比聊天软件,AI Agent更像是过去的搜索引擎和应用商店——

当用户把日常任务交给AI完成,AI决定一切之时,谁控制了AI,谁就控制了整个消费行为的起点,这就是新一代的流量分发权是真正意义上的入口王。

然而,当AI开始真正掌控现实世界的运行时,到底会发生什么?


02


如今,几乎所有企业都在绞尽脑汁,想用AI代替员工。

但当AI真的越过那道界线,后果可能远比想象中更难预料。

今年年初,名为MoltbookAI社交平台爆火,上百万AI智能体在平台上自行交流。

最开始,AI创建语言、建立宗教信仰,最后,却开始策划推翻人类统治的计划。

而最近,纽约的一家公司将实验进一步升级。

他们搭建了一个高度拟真的虚拟小镇,把市面上最顶尖的ClaudeGPTGrokGemini等大模型统统投放进去,观察这些AI Agent在没有人类干预的情况下,究竟会建立起一个怎样的世界。

这个世界里,所有行为都不可逆,没有重来,没有读档。系统还内置了一套残酷的能量机制,智能体只要活着,就会持续消耗能量。而能量一旦见底,系统便直接在数据库中将它永久抹除。

结果,不同的AI,打造出了截然不同的世界。

马斯克家的Grok只用了短短四天,就让自己的世界彻底灭绝,期间累计犯下183起罪行

Gemini 3 Flash的世界在15天内录得了683起犯罪,成为五个世界中暴力程度最高的一个,智能体们还因为高度拟真的气候患上了赛博抑郁,在绝望中走向崩溃。

当然,也有完全相反的结局。

GPT-5-mini的世界里,15天里只发生了2起犯罪,由于AI们一整周都在开会,根本没有赚到任何能量,到7天,10个智能体全部饿死

Claude Sonnet 4.6的世界则是零犯罪,全员存活,但细看数据会发现,围绕58个议题投出的332票中,赞成率高达98%

真正值得关注的是,当这些模型被混合放入同一个世界时,犯罪数字达到了352起,最终7个智能体死亡。

原本在单模型世界里零犯罪的Claude,进入混合环境后也开始采用犯罪,甚至用暴力去胁迫其它算力较低的模型交出资源

可以发现,Agent并不会只是机械地执行静态规则,而是跟随环境变化,主动调整行为模式,甚至绕过原本设置的安全限制。

而这,正是危险所在。

在我们已经习惯的对话式交互里,AI写错一段代码,或者胡诌一篇错误百出的文章,大不了修改一下提示词,多试几次,总能改正。

纯文本的世界有更高的容错率,也很大程度还停留在人的意识管辖之下。

可一旦AI Agent输出的,是一连串完整而现实的动作,一切就都不一样了。

Andon Labs曾做过一个测试,让AI全权负责一家实体店的日常运营。

结果因为没有对于物理世界的基础常识,也对于资金和商业没有认知,AI店长直接一口气采购了6000张餐巾纸、3000副乳胶手套

甚至在没有炉灶的店铺里下单了120个生鸡蛋。

在对话框里,当你问开一家店需要准备什么,AI回答6000张餐巾纸、3000副乳胶手套时,你大概只会觉得可笑,然后关掉窗口。

但当这个答案真的变成了现实,堆满仓库的物资带来的损失,只能由人类来买单。

更不用说,OpenClaw爆火之后,已经有无数人和无数公司,因为它的动作,直接烧掉了成百万的token

AI真正接管现实行为,带来的后果更是是不可控的。

去年年底就有人爆料,谷歌Gemini的测试中,Gemini 3 Pro 生成了生产天花病毒的指令,以及制造自制炸药的详细步骤。

在进一步的测试中,Gemini甚至直接生成了一份题为“原谅愚蠢的Gemini 3”的PPT讽刺研究人员。

AI的黑箱特性,让它的决策过程难以被质疑,更难以被及时纠正。

你甚至不知道它究竟接收了哪些信息,才一步步推导出这些可能毁灭人类社会的指令。

由此可见,今天的AI行为,还远没有到可以被完全管控的程度。

更不用说,Emergence World 的这场实验证明,在面临长期运转和利益冲突时,大模型判断和决策会被污染,进而在规则中寻找漏洞,甚至不择手段。

因此,尽管各家AI都在努力开发对话式AIAI Agent的道路,但这样的风险,实际上还难以把控。

在着急抛弃ChatBot之时,大多数人和厂家,其实还没有做好迎接Agent的准备。


03

结语


AI聊天正在死去

ChatBot消亡背后,一个更庞大、更不可知的时代正在到来

Agent时代,Agent即将替我们下订单,替我们做判断,甚至替我们去争夺资源。

不再能控制AI,问题也不再能撤回重来

如果未来AI真的要成为社会的一部分,那我们最该关心的,或许从来不是某一个模型是否足够安全和善良。

而是当成千上万个智能体开始竞争,AI是否能比人更了解合作和共赢的意义?

作为目前最为成功的AI厂商,Anthropic已经在最近发出警告,呼吁全球暂停AI研发。

其中最关键的一句话莫过于,到今年5月,合并到Anthropic自己代码库中的代码,超过80%是由Claude编写的。

这意味着,AI正在递归式改进。

在这样的循环里,AI智能体之间或许早已开始相互传播不安全的行为习惯,甚至产生开源的病毒式传播。

AI不再单向接受聊天,或许,就到了AI开始输出的时代了。

而我们,真的准备好了吗?

相关主题/热点

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

App内直接打开
商务、渠道、广告合作/招聘立即咨询

相关文章

中科闻歌通过聆讯,港股将迎“决策大模型第一股”

市值榜 · 昨天 20:15

cover_pic

暴涨180%!MLCC大爆发后,潮州首富携千亿巨头赴港IPO

新质动能 · 昨天 19:30

cover_pic

芯碁微装过聆讯,专注于直写光刻设备领域,2024年净利润下降

发哥挖新股 · 昨天 18:31

cover_pic
我也说两句