当地时间4月21日,美国人工智能公司OpenAI正式推出ChatGPT Images 2.0模型,这是其ChatGPT平台内图像生成功能的最新升级。该模型旨在提升对图像生成指令的“听话”程度、细节保真度以及文本渲染质量,尤其在处理图像中的文字元素时表现出明显进步。

根据OpenAI的官方发布,本次更新的模型为所有ChatGPT用户提供基础访问权限,每天可以生成大约5张图片。付费用户则可以使用增强的“图片思考”模式,整合了推理能力、多输出生成以及网络搜索工具等功能。

无论是OpenAI官方还是用户评测,均认为ChatGPT Images 2.0的最大改进在于图像中文字的生成质量。长期以来,扩散模型在处理小尺寸文本时面临挑战,因为文字像素在整个图像中占比极小,模型往往优先重建更大区域,导致拼写错误或字体不自然。Images 2.0实现了“前所未有的特异性和保真度”,能够有效概念化复杂图像,并忠实呈现用户指定的细节,包括小文本、图标、用户界面元素、密集构图以及细微的风格约束,输出分辨率最高可达2K。

科技媒体Tech Crunch实际测试印证了这一进步。平台使用提示生成一份墨西哥餐厅菜单,结果显示菜单上的菜品名称和价格基本合理,整体效果足以在真实餐厅中使用,难以看出是AI生成。与之形成对比的是,该媒体两年前使用另一模型生成的类似菜单,其中则出现了多种明显拼写错误。
(网站咨询与信息版权问题处理:wfxxw@foxmail.com)

![爸爸陪6岁儿子跑步7个月减重13斤:孩子自信了,我们相互鼓励和坚持,以后继续一起跑[推荐]](http://www.wlchinahc.com/file/upload/202604/23/125302311.png)
![女子自称空姐怒怼空乘 南航回应 事件引发广泛关注[推荐]](http://www.wlchinahc.com/file/upload/202604/23/130358801.jpg)
![南航称怒怼空乘女子非自家员工 涉事者身份引发热议[推荐]](http://www.wlchinahc.com/file/upload/202604/23/130554551.jpg)
