国君传媒:豆包实时语音大模型上线,AI交互水平再升级

1 年前7.8k
豆包实时语音大模型上线,该模型一举实现理解情绪、联网、控制语气语调、随时打断等效果,交互水平的提升对于AI软硬件场景落地都将是显著帮助。
本文来自格隆汇专栏:国泰君安证券研究,作者:陈筱、杨昊

事件:1月20日,豆包实时语音大模型正式推出,并在豆包APP全量开放。

该模型可理解输入语言情绪、实时联网,在输出时具备强大声音控制能力,且高度近似人类、有超低延迟、可随时打断。其真人级语音对话能力具体表现在以下方面:1)拟人化的情感承接,能够理解用户的内容及情绪,并用恰当的语气做出回应;2)强大的声音控制和丰富的情感演绎能力,能够遵循丰富的复杂指令,配合不同的音色、情绪及状态输出,可以讲故事、讲方言和口音、甚至唱歌;3)智商与表现力之间的平衡,该模型的表现力高度接近真人,包括类人的语气词、停顿思考等,模型也有实时联网功能,使其能够根据问题,动态获取最新信息,对时效问题给到精准、及时的回应;4)丝滑的交互体验和超低延迟,实现在更低系统时延情况下的生成准确性、自然度,并且具有敏锐的语音打断与用户对话判停能力。

豆包实时语音大模型的整体满意度较GPT-4o有明显优势,特别是在语音语气自然度和情绪饱满度方面远高于后者。豆包团队围绕拟人度、有用性、情商、通话稳定性、对话流畅度等多个维度选取数十名外部测试者进行考评,豆包实时语音大模型整体满意度(以5分为满分)得分为4.36,GPT-4o为3.18,超过半数的测试者对豆包模型表现打出满分,且豆包模型在情绪理解和情感表达方面优势明显,尤其在“一听就是AI与否”的评测中被认为AI的概率极低。

我们认为,增加了情感的语音交互将显著有利于AI的软硬件应用,能够降低使用门槛、改进效率、提升体验,包括如下应用场景:1)情感陪伴与智慧教育应用;2)AI陪伴硬件如AI玩具、AI宠物,可帮助硬件生产商与IP方扩大需求;3)AI眼镜、AI耳机、AI音箱等生活效率产品将受益于交互方式的改进。

风险提示:AI应用落地进度不及预期,商业化进展不及预期,相关公司主营业务业绩压力。

注:本文来自国泰君安2025年1月20日发布的《豆包实时语音大模型上线,AI交互水平再升级》,报告分析师:陈筱、杨昊

本订阅号不是国泰君安证券研究报告发布平台。本订阅号所载内容均来自于国泰君安证券研究所已正式发布的研究报告,如需了解详细的证券研究信息,请具体参见国泰君安证券研究所发布的完整报告。本订阅号推送的信息仅限完整报告发布当日有效,发布日后推送的信息受限于相关因素的更新而不再准确或者失效的,本订阅号不承担更新推送信息或另行通知义务,后续更新信息以国泰君安证券研究所正式发布的研究报告为准。

本订阅号所载内容仅面向国泰君安证券研究服务签约客户。因本资料暂时无法设置访问限制,根据《证券期货投资者适当性管理办法》的要求,若您并非国泰君安证券研究服务签约客户,为控制投资风险,还请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。如有不便,敬请谅解。

市场有风险,投资需谨慎。在任何情况下,本订阅号中信息或所表述的意见均不构成对任何人的投资建议。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。国泰君安证券及本订阅号运营团队不对任何人因使用本订阅号所载任何内容所引致的任何损失负任何责任。

本订阅号所载内容版权仅为国泰君安证券所有。任何机构和个人未经书面许可不得以任何形式翻版、复制、转载、刊登、发表、篡改或者引用,如因侵权行为给国泰君安证券研究所造成任何直接或间接的损失,国泰君安证券研究所保留追究一切法律责任的权利。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

App内直接打开
商务、渠道、广告合作/招聘立即咨询

相关文章

聚烯烃冷却器市场前景与产业链洞察报告2026年

QYResearch信息咨询 · 5分钟前

cover_pic

7.0%增长率商用锂电钻市场发展轨迹,调研报告专业解读来袭!

环洋市场咨询 Global Info Research · 5分钟前

cover_pic

2026年玻璃纤维电子纱市场需求调研:年度报告和十五五未来潜力展望

QYResearch信息咨询 · 5分钟前

cover_pic
我也说两句