16:20
阿里开源全模态大模型Qwen3-Omni 可像人类一样听说写
格隆汇9月24日丨阿里巴巴发布通义全模态预训练大模型Qwen3-Omni系列模型。在36个音视频基准测试中,Qwen3-Omni系列模型有22项达到SOTA水平,其中32项取得开源模型最佳效果,语音识别、音频理解与语音对话能力可比肩Gemini2.5-Pro。作为全模态模型,Qwen3-Omni能够实现全模态输入和全模态输出。类似于人类婴儿一出生就全方位感知世界,Qwen3-Omni一开始就加入了“听”“说”“写”多模态混合训练。在预训练过程中,Qwen3-Omni采用混合单模态和跨模态数据。Qwen3-Omni在实现强劲音频与音视频能力的同时,单模态文本与图像性能均保持稳定,这是业内首次实现这一训练效果。
相关股票

US 阿里巴巴 HK 阿里巴巴-W

2025-09-24309.3k

商务、渠道、广告合作/招聘立即咨询

相关文章

美伊正磋商45天停火框架 力争永久终结冲突

默德君 · 7小时前

cover_pic

金融圈炸锅!分析师冒死深入霍尔木兹海峡:航道根本没关!

小摩根 · 1小时前

cover_pic

史诗级暴跌“一周年”,A股接下来如何走?

哥吉拉 · 6小时前

cover_pic