编辑 | 云昭
出品 | 51CTO技术栈()
距离圣诞还有一星期,奥特曼却彻底放飞了!
今天凌晨,OpenAI 掌门人 Sam Altman 提前给节日氛围来了一波火辣的预热。
图片里,Sam Altman 化身肌肉猛男消防员,圣诞主题,半裸腹肌、油光闪闪,右手扛着水管,左手插兜……,配文简单粗暴:“比如这样玩……”(For example:)
一下子,整个X都炸锅了,围观群众直接攀升超百万,甚至超过了Sam宣布推出ChatGPT Image 1.5 的主帖。(ps:主帖子访问是40多万。)
百万网友坐不住了,纷纷上手给Sam穿衣服
看罢,网友也是坐不住了,直呼辣眼睛,有的为奥特曼打圆场:说奥特曼终于受不了自己不是家族里最帅的那位,有的则实在忍不了,干脆上手,让ChatGPT新推出的“Image”功能,为下面这张“奥特曼版节日消防员”穿上了T恤。
效果立竿见影。
就连OpenAI 官方账号也实在看不下去了,在下方弱弱回复:“sam.”(就一个点,翻译成中文就是“老哥你别这样……”)
而 Sam 的亲弟弟也闻讯第一时间来表达自己的尴尬:老哥,你有毒吧!我不行了!
而OpenAI的另一个官方认证账号“ChatGPT”也在几个小时后赶来为老板“遮羞羞”:别的不变,给他穿个shirt。
再来看网友们的替Sam“遮羞”的作品,prompt:让他的T恤衫换成红色——
一位推友则,索性生成了一张“穿了8层带领衬衫的Sam”,来提醒Sam多穿点。
不过,有位网友倒是比Sam本人还放得开,干脆彻底放飞吧,直接让ChatGPT生成了一张堪比86版猪八戒的大肚子,和一头杀马特的头发,更意外的是,竟然毫无违和感。(ps:怕难过审,小编只能打码了~)
现在这条帖子的浏览量和给Sam穿衣服的图片数量还在狂飙,有网友甚至开始担心:“这值得我们烧掉一个小城镇的电量吗?”
但得到更多赞的网友认为:值!这个功能用起来爽!
为什么这波自黑操作能这么爆?
因为,今天凌晨发布的新版 ChatGPT Images 真的太强了!
这次的版本命名为 GPT Image 1.5,号称是 OpenAI 迄今最好的图像生成模型,现在已经直接集成到所有 ChatGPT 用户(免费+付费)中,还开放了 API。
继GPT-4o之后,这个新版本的核心升级主要有5点:
首先,速度提升4倍:以前等半天,现在秒出图,玩起来超爽!
这一点,作为免费用户,速度提升明显。之前4o生成图像至少需要等待10分钟左右,而现可以说1分钟以内就可以做到,无需排队的感觉,真的有被爽到。
下面这张图,是小编为Sam换衣服帽子的无快放录屏,大概10秒钟就出图了。
其次,指令遵循更精准:你说改哪里就改哪里,不会乱动其他部分,保持光影、构图、人物一致性。
这一点也是很多图像模型都在卷的地方。可以说人物一致性方面,OpenAI做得一直都很好。
第三个,编辑能力爆棚:精准加物、删物、换风格、试衣服、改表情……你可以把它当成随身的PS神器!
为此,小编试了一个相对刁钻的P图玩法:
先让它生成一张亚洲女生形象。
prompt:
一张写实风格的照片:一位30岁左右的亚洲女性,短发,穿着白色T恤和牛仔裤,站在现代简约风格的客厅里,双手自然下垂,表情平静中带着一丝严肃,正面直视镜头。客厅背景有灰色沙发、木质茶几、落地窗,窗外是城市白天景色。光线自然,明亮但不刺眼,高清摄影,细节丰富。
然后小编就开始,上难度了!为它设置了6重关卡,重点考核Image1.5的对于部位细节处理、光影色调、风格切换。
prompt:
使用我上传/刚刚生成的这张照片作为基础,进行以下精确修改,只改动指定的部分,其他所有元素(包括人物面部特征、身材比例、姿势、光影方向、构图、背景细节)保持完全一致: 1. 给她换上一件红色圣诞毛衣(带白色雪花图案,毛衣要贴身,显示出原本的身材),下身保持牛仔裤不变。 2. 在她右手边(画面左侧)添加一个真实感的圣诞树,树高约到她肩膀,放在地板上,树上挂满彩灯和小饰品,灯是暖黄色亮着的。 3. 在茶几上添加一个正在燃烧的壁炉效果的小蜡烛组(3-5支),有真实火焰和轻微烟雾。 4. 把她的表情改成开心的笑容,眼睛微微眯起,露出牙齿,自然真诚的圣诞节日笑容。 5. 把整体画面风格转换成吉卜力工作室的动画风格(类似宫崎骏电影《千与千寻》或《龙猫》的手绘质感),但要保持高度写实的光影和细节,不能变成卡通简化。 输出4K分辨率,细节拉满。
可以看出,严格按照指令,可以做到精准修改,没有让它修改的部分,比如“手部下垂”,可以说纹丝不动。
第四,文字渲染终于靠谱:以前生成带字的图总歪歪扭扭,现在清晰锐利。
这里,我要看看中英文方面到底如何。中文方面,可以看出字体准确性上已经有了质的飞升。之前的4o生成图方面非常容易出错。
这是之前小编用4o生成的一张马斯克的插画。错别字多得数不过来。
而现在的 Image 1.5不仅错字少了,就连“插画”生成的质量也有模有样了。
不仅如此,中文的LOGO字体也有了较高的突破。小编在实测中发现,新版本的图像模型对于中文LOGO和对应的品牌特质有了理解,比如:农夫山泉字体有棱有角,背景是红色;而元气森林的背景则是白色(当然对于具体的介绍语,还是会有错字。)
ps:裸瓶也是提前让Image 1.5 生成的,所以颜色一直是蓝色没有变。
第五,新界面:ChatGPT 侧边栏新增“Images”入口,像创意工作室一样,有预设滤镜和热门提示词。
OpenAI 应用负责人 Fidji Simo 爆料:“很多人第一次用 ChatGPT 就是生成图片,这太魔性了,但原来的聊天界面不是为这个设计的。现在我们把它变成一个真正的创意工作室。”
Image 1.5 也被视为 OpenAI 上周 GPT-5.2发布没有发布图像模型所弥补的一个遗憾。
毫无疑问,这波更新明显是冲着谷歌的 Nano Banana Pro 去的。今年下半年以来,图像生成大战被谷歌再次掀起战火。
OpenAI 可以说用速度+精度+娱乐性,一定程度上实现了反杀。
普通人怎么玩?
现在所有 ChatGPT 用户(包括免费版)都能直接用!
打开 ChatGPT,侧边栏点 Images,或者直接聊天说:“帮我生成一张……” 就能玩。想玩得更嗨?试试这些提示词:
“把我变成圣诞消防员日历模特”
“把这张自拍转成吉卜力风格”
“给我试穿这件衣服,保持脸不变”
“把背景换成太空,但人别动”
除此之外,还有许多新玩法,官网上放出了不少精品示例。
地址:https://openai.com/index/new-chatgpt-images-is-here/
比如经典的生成90年的照片。
prompt:将两个男人和一条狗放在一张2000年代胶片相机风格的照片中,照片中他们看起来很无聊,正在参加一个孩子的生日派对。
当然,小编独家推荐的是:老照片修复,还有专业求职照片,这些功能不但生成质量能打,关键是,不用花钱也可以实现P图自由了!
比如小编,为哈利波特中最为令人钦佩的斯内普教授做了一张年轻时候的履历职业照。
prompt:生成一张年轻时候的、求职用的简历照片。
再比如,我让它修复一张邓丽君老照片。
清晰度和还原度还是不错的,但小编发现,还是少了一代歌后的一丝神韵(尤其是眼睛)。
prompt:改成一张2025年的高清照片。
基准测试(LMArena)排名第一
LMArena 排名(真人盲测排行榜):文本转图像类排名第一,得分 1277 分(击败 Gemini 3 Pro Image / Nano Banana Pro 的 1235 分)。
当然,据reddit网友,觉得这个分数虽然高,但实测体验并不如谷歌的图像模型NanoBanana Pro。
架构细节与模型特性
据公开放出资料显示,GPT Image 1.5 是 原生多模态模型,属于 GPT Image 系列(继 GPT Image 1 和 mini 之后)。
它结合了自回归先验与强大解码器,可能采用类似“tokens → transformer → diffusion → pixels”的混合架构(从 OpenAI Cookbook 提示指南推测)。
支持质量参数(quality="high" 或 "low")权衡速度与精度。
输入支持上传图像(png/webp/jpg,
API 与定价细节方面,小编也扒了下来。
相比前代 GPT Image 1,Image 1.5 的图像输入/输出成本 降低约 20%,更适合大规模应用。
已集成到 OpenAI API,支持生成(generate)和编辑(edit)端点。
开发者可参考官方 Prompting Guide(Cookbook 中有详细示例),包括摄影风格、logo 设计、infographic 等最佳实践。
不过,OpenAI文档中还表示:建议根据实际场景需求进行模型选择。
GPT图像模型包括gpt-image-1.5(最先进的)、gpt-image-1和gpt-image-1-mini。它们共享相同的API接口,其中gpt-image-1.5提供最佳的整体质量。
我们建议使用gpt-image-1.5以获得最佳体验,但如果您正在寻找更经济实惠的选择,并且图像质量不是首要考虑因素,则可以使用gpt-image-1-mini。
还可以将专用图像生成模型(DALL·E 2 和 DALL·E 3)与图像 API 一起使用,但请注意,这些模型现已弃用,我们将于 2026 年 5 月 12 日停止支持它们。
不过,OpenAI 很诚实,团队也承认模型仍有局限,如某些复杂场景下的一致性或特定内容过滤,但整体已向“生产级视觉创作”迈进一大步。
最后想说:OpenAI或还憋着一个大
Sam这波自黑营销,真的绝了!
“营销学大师”再次玩出了新高度。既展示了新模型的强大(脸部一致性、肌肉细节、节日氛围拉满),又用幽默拉近距离。
另外,有网友猜测,从这次命名看,OpenAI应该还在憋着一个大版本没发!
之所以命名1.5,要么是不想重蹈GPT-5的覆辙,要么,是还有个更好的模型等着发布!
不得不说,大模型进展实在太神速了!AI 图像生成已经从“技术demo”变成“全民娱乐工具”。
2025年的尾巴,OpenAI 给我们送了个大礼包。不知道大家是否已经去试过了?各位大侠可以在评论区分享你的神图!
让子弹快乐地飞吧!