数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 52|回复: 0

[业界] 太魔幻了!刚刚OpenAI发布GPT Image 1.5:Nano Banana Pro王座不保

[复制链接]
发表于 5 小时前 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
本帖最后由 刘绪刚 于 2025-12-17 08:36 编辑

AI寒武纪





Sam Altman 反击谷歌,OpenAI新旗舰图像模型来了
就在刚刚,OpenAI正式发布了新版ChatGPT Images,由全新的旗舰图像生成模型GPT Image 1.5驱动
这一次,无论是从零开始生成图像,还是编辑现有照片,新模型都能实现“所想即所得”

核心升级主要体现在三个方面:精准修图且保留细节指令遵循能力更强,以及生成速度提升了4倍
我立马就测试了两个手头的case:ChatGPT Images vs Nano Banana Pro
提示词
这是一张室内人像写真风格的照片,整体偏向干净、柔和、略带时尚感与亲密氛围,下面我从构图、人物、服装、姿态、光线与整体气质几个层面来忠实、细致地描述:
一、整体构图与环境
•竖幅构图,人物几乎占据画面主体,视觉重心集中在人物的上半身与面部。
•场景是一个简约现代的室内空间,背景为大面积纯白色墙面,干净、无杂物,刻意弱化环境存在感。
•人物坐在一张黑色皮质沙发上,沙发表面线条硬朗,与人物柔和的肤色形成对比。
•沙发上铺着一块黑白相间的长毛绒毯,毛感明显,增加了画面的层次与触感⸻
二、人物外貌与面部特征
•人物为一位年轻女性,整体气质偏清秀、柔和。
•肤色白皙均匀,质感细腻,几乎看不到明显瑕疵。
•脸型偏鹅蛋脸,下颌线柔和,没有明显棱角。
•五官比例协调:
•眼睛偏大,双眼皮清晰,眼神平静、直视镜头,带有一点若有若无的疏离感。
•鼻梁挺直但不夸张。
•嘴唇偏小,唇色自然,表情克制,没有明显微笑。
•整体妆容为清淡自然妆:
•底妆轻薄
•眼妆干净,没有明显烟熏或夸张色彩
•唇妆偏裸色或淡粉色
三、发型与发质
•长直发,发色为偏暖的深棕色。
•中分发型,分缝笔直,左右对称。
•头发顺直、贴合,发尾自然垂落至腰部附近,整体显得柔顺、有光泽。
•发量看起来较多,线条干净,没有明显卷度。
四、服装细节
•穿着一件白色蕾丝连衣裙:
•无袖设计,露出肩部与手臂
•V 领或浅领口,领口处有精细的蕾丝花纹
•裙身贴合身体曲线,但并不夸张
•裙摆长度偏短,停留在大腿中上部
•面料为蕾丝+内衬结构,蕾丝纹理清晰,风格偏女性化、柔美。
五、姿态与肢体语言
•人物以侧坐姿坐在沙发上:
•上半身微微前倾
•一只手自然搭在沙发或毛毯上
•另一只手轻放在腿部
•双腿弯曲收拢,姿态显得放松而内敛。
•整体肢体语言偏安静、克制、略带亲密但不过分张扬。
六、光线与摄影风格
•使用的是柔和的棚拍或自然补光:
•光线均匀,没有强烈阴影
•面部和身体轮廓被柔化
•色温偏中性或微暖,突出肤色的细腻感。
•背景虚化不明显,但因背景简洁,人物自然突出。
•整体风格接近商业人像 / 时尚写真 / AI 或高精修风格。
七、整体气质总结
这张照片给人的感觉是:
•干净
•精致
•柔和
•带一点冷静与疏离
•偏“被观看”的人像美学,而非抓拍或纪实
2k分辨率
这是生成的效果:

第二个case:
提示词:
{
描述:一幅超逼真的 3D 等距视角杰作,描绘了一幅展开在光滑深色木桌上的魔法地图。地图绘制在一张古老而饱经风霜的羊皮纸卷轴上,但画面中的景色以立体模型的形式跃然纸上。巍峨的岩石山脉,白雪皑皑的山峰,穿透缕缕白云;一条蜿蜒的碧绿河流从中心流过;山麓覆盖着茂密葱郁的松林。羊皮纸边缘呈锯齿状,左侧饰有精美的复古书法,角落则绘有罗盘玫瑰图案。画面采用温暖的电影级光照,焦点清晰,纹理细节丰富,2K 分辨率,以奇幻冒险为主题。
"negative_prompt": "扁平的,2D 的,简单的图画,模糊的,低质量的,扭曲的,有水印的,糟糕的人体结构,文字叠加,颗粒感强的",
“参数”: {
"aspect_ratio": "2:3",
"风格": "电影级 3D 渲染",
"视图": "等距"
}
}
生成的效果:

看起来ChatGPT Images指令遵循的要比NBR要强(人像),审美能力还不好说
目前ChatGPT Images 在 大模型竞技场图像排名第一

接下来几天我会大量测试,看看实际表现
与此同时,GPT Image 1.5 API也已同步上线,价格相比上一代直降20%
下面我们一起来看ChatGPT Images具体细节
精准修图:指哪打哪,细节不丢
新版模型最大的亮点在于对用户意图的精准还原
当用户要求对上传的图片进行编辑时,模型能够更可靠地遵循指令,仅改变用户要求的部分。
而在这一过程中,原图中光线、构图以及人物外观等关键要素,都能在输入、输出及后续的连续编辑中保持一致
这就意味着,ChatGPT现在不仅能完成更实用的照片修饰,还能实现更逼真的服装和发型试穿。同时,它支持在保留原图精髓的基础上,进行风格化滤镜和概念转换
具体到编辑操作上,模型擅长多种类型,包括:
• 添加(Adding)
• 删减(Subtracting)
• 组合(Combining)
• 混合(Blending)
• 移位(Transposing)







简而言之,用户可以在得到想要的改变的同时,不丢失让图片显得特别的那些原始细节。OpenAI称其为“口袋里的创意工作室”
创意与能力的全面进化
除了修图,GPT Image 1.5在创意生成和基础能力上也有显著提升:
创意变换:模型可以通过改变和添加元素(如文本和布局)来实现创意转化,同时保留重要细节,这个和Nano Banana Pro表现感觉差不多







更强的指令遵循:相比初代版本,新模型能更可靠地执行指令。这不仅利于精准修图,也能在生成复杂的原创构图时,按预期保留元素间的关系

文本渲染能力强悍升级:在处理更密集、更小的文本时,模型表现强悍



画质提升:在渲染许多小人脸以及整体输出的自然度等方面,质量均有改进

全新交互:无需提示词也能玩
为了让图像探索更快捷,OpenAI在ChatGPT中推出了专门的Images主页
用户可以通过移动应用的侧边栏或chatgpt.com访问该页面。这里不再强制要求用户编写提示词,而是内置了数十种预设的滤镜和提示,帮助用户快速启动灵感
这些预设内容会定期更新,以反映当下的流行趋势
API上线:更便宜,更适合企业
对于开发者和企业用户,GPT Image 1.5 API也已同步开放。
相比GPT Image 1,新版API在图像输入和输出的价格上便宜了20%,这意味着在相同预算下可以进行更多的生成和迭代。
在能力上,API版本继承了ChatGPT Images的所有改进,特别是在图像一致性方面表现更强:
能够跨编辑保持品牌Logo和关键视觉元素的一致性
非常适合营销材料制作(如图形和Logo创作)
适用于电商团队,可基于单一源图像生成完整的产品目录(包括不同变体、场景和角度)
目前,已有创意工具、电商、营销软件等领域的企业开始使用GPT Image 1.5。
最后
ChatGPT Images的新版本即日起向全球所有ChatGPT用户和API用户推送。
该功能跨模型工作,用户在使用时无需进行额外选择
至于今年早些时候推出的旧版ChatGPT Images,将作为一个自定义GPT(Custom GPT)保留,供有需要的用户继续使用


您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-12-17 13:51 , Processed in 0.078000 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表