
千问Qwen-Image-2.0实测:中文渲染惊艳,堪称媒体人的Banana?
好家伙,千问春节前扔出图片大模型王炸,不仅能吃下 1k token 指令,还能渲染中文书法。也就是说,从今天开始,文生图大模型不再是玩具,而是生产力工具!
那么问题来了,Qwen-Image-2.0 到底强在哪呢?
今天小雷就带大家伙见识一下 Qwen-Image-2.0 的威力。
生活个人形象照太土,发给客户看,客户觉得不够高大上?
别慌也别急!立马给你手搓一张新的。
下面我们所看到的都是由千问生成的“高大上”形象照。它可以根据我们要求的不同风格、不同着装,生成一组又一组的照片。
不光能手搓形象照,我们还可以这样玩儿。
输入提示词:让图中的女孩穿上风衣坐在露营椅上,OOTD 拼图轻松拿捏。
生成的图片分辨率高达2k,非常有质感,我觉得可以直接拿来用了。
在生成后,我还可以持续编辑我的指令,直到得到理想的图片为止。
体验了一波后,我愿称之为中文版 Nano Banana!
不信咱继续看看实测!
小雷让千问生成一张苏东坡《念奴娇·赤壁怀古》的意境图,展示词作的雄浑苍凉,大气磅礴,图中还要有这首词的关键文字。
不只是文字没错,而且字体苍劲有力、人物形象传神,细节要求都有落实。
但你知道吗?在过去大模型生成图片都很难渲染汉字。
我试了下即梦的 seedream,字体看上去挺好看,但文字却是错的,存在“画汉字”的老毛病。
看到这,可能有人会问,之前的图片生成王者 Nano Banana Pro 呢?
别急,小雷当然也试过啦,来看看效果。
整体还可以,但存在错字、多字的情况。
但千问这波却能准确渲染上百个汉字,且处理长文本指令是 Qwen-Image-2.0 最大的突破,它能一口气吃下 1000token,业界最长,没有之一。
除了处理长文本指令精准以外,“美”也是 Qwen-Image-2.0 文字渲染的一大特色,不信你看。
不过普通用户可能不会输入这么长的指令,但我们可以给它一大段的指令,提出非常具体、详细的要求,让它生成图片、PPT、海报。
比如针对 xAI 近期的人物动荡新闻,我让它生成一张新闻海报,还真能用。
再比如针对数码圈常见的“果粉梗”,我让它画了一组漫画。
图源:千问
如果你不想输入长指令,哪怕你只输入一句话,千问提示词增强功能都会调用大模型,合理扩展提示词(多达1000字),进而给到更好的生成效果。
这不是马上临近春节了吗,有朋友要来广州和我一起玩儿,我让千问生成一个介绍广州的创意3D图片。要求是建筑大小比例正确,金桔、福字、醒狮、元宝、灯笼等细节逼真。
没想到,千问背后的Qwen-Image-2.0对复杂指令的理解太强了,而且还通过联网搜索自己去推理出广州相关的画面元素,广州塔、东西塔,该有的地标它全都有。
我们再来看看微观视角下,千问的表现如何。
微观生成的效果更惊艳,这张图除了小蚂蚁的细节,露珠、树根、光影、苔藓等细节都很逼真,远处的深圳地标建筑也呈现得很到位。
有了“准”、“多”、“美”的表现,那 Qwen-Image-2.0 不得来个“真”体验。
瞧瞧,除了生物以外,人物形象的生成也不在话下,这是千问为我生成的《西游记》的海报。
还能改为迪士尼、梵高印象派、二次元、乐高、连环画这样的风格,展现出强大的编辑能力。
图源:千问
要小雷说,千问这一波更新绝对称得上是超级王炸。去年一骑绝尘的 Google Gemini Banana 成为现象级产品,如今中国终于有了一个能打的文生图大模型了。
而且值得一提的是,在权威第三方评测 AI Arena 中,Qwen-Image-2.0 文生图得分 1029,排名第三!图像编辑得分 1034 分,全球第二,仅次于 Nano Banana Pro。强烈建议大家去体验其强大的多场景创作能力,一定会发现超多惊喜~
话说,2026 年大模型的神仙斗法才刚刚开始。不知道在座各位平时有没有用过千问呢?感觉如何?欢迎评论区一起唠唠~
US 阿里巴巴
格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。


