麦享科技2月10日消息,今日,阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0。
作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中斩获1029分,超过Seedream4.5、Flux2-Max等模型,仅次于谷歌Nano Banana Pro和GPT Image1.5。
Qwen-Image-2.0支持1K token的超长文字输入和2K高分辨率,可准确渲染复杂指令,轻松生成专业的PPT及信息图,质感媲美专业级摄影师;同时,千问新模型拥有极强中文汉字渲染能力,数百字的古文全文几乎都能完全渲染在图片中。

Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit两大模型基础上全新升级,首次将图像生成和编辑统一到一个模型中去,以更轻量的模型架构,实现了生图和改图性能的大幅提升。
Qwen-Image-2.0生图质感尤为细腻,小至老人皱纹的褶皱,大到浩然宇宙,模型生成的人物、自然、建筑等常用图片都极其逼真。
在权威评测AI Arena中,千问新模型在图像生成中得分1029,位列第三;在图片编辑中得分1034,仅次于Nano Banana Pro。

在中文汉字渲染方面,Qwen-Image-2.0表现极为突出,不但可以以多种字体准确渲染汉字,而且写得又多又准,效果比 Nano Banana Pro更优。
千问新模型将输入提示词扩展到1K token,可详尽描述任务,实现更专业的文字渲染,轻松拿捏专业PPT、高级海报、多格漫画等复杂图片,比如以小楷字体几近完全渲染《兰亭集序》数百字的全文配图,以自然语言生成论文格式配图的复杂PPT等。

基于Qwen-Image-2.0模型,用户可与AI协同创作出更丰富、更实用的图片,比如一句话生成宫保鸡丁的做法流程图,杭州两日旅游攻略图,4x6的多格漫画组图,儿童绘本图,写实风格的电影海报,极为逼真的绿色丛林等等;
同时,用户也可上传数张图片进行编辑,生成诸如九宫格多手势自拍,真人配字表情包,双人逼真AI合影,诗词配图等。


微信扫一扫打赏
支付宝扫一扫打赏