就在刚刚,OpenAI正式发布了新版ChatGPT Images,由全新的旗舰图像生成模型GPT Image 1.5驱动。

Sam Altman 反击谷歌,OpenAI新旗舰图像模型来了。

就在刚刚,OpenAI正式发布了新版ChatGPT Images,由全新的旗舰图像生成模型GPT Image 1.5驱动。

这一次,无论是从零开始生成图像,还是编辑现有照片,新模型都能实现“所想即所得”。

核心升级主要体现在三个方面:精准修图且保留细节指令遵循能力更强,以及生成速度提升了4倍。

我立马就测试了两个手头的case:ChatGPT Images vs Nano Banana Pro。

提示词

这是一张室内人像写真风格的照片,整体偏向干净、柔和、略带时尚感与亲密氛围,下面我从构图、人物、服装、姿态、光线与整体气质几个层面来忠实、细致地描述:

⸻

一、整体构图与环境
•竖幅构图,人物几乎占据画面主体,视觉重心集中在人物的上半身与面部。
•场景是一个简约现代的室内空间,背景为大面积纯白色墙面,干净、无杂物,刻意弱化环境存在感。
•人物坐在一张黑色皮质沙发上,沙发表面线条硬朗,与人物柔和的肤色形成对比。
•沙发上铺着一块黑白相间的长毛绒毯,毛感明显,增加了画面的层次与触感⸻

二、人物外貌与面部特征
•人物为一位年轻女性,整体气质偏清秀、柔和。
•肤色白皙均匀,质感细腻,几乎看不到明显瑕疵。
•脸型偏鹅蛋脸,下颌线柔和,没有明显棱角。
•五官比例协调:
•眼睛偏大,双眼皮清晰,眼神平静、直视镜头,带有一点若有若无的疏离感。
•鼻梁挺直但不夸张。
•嘴唇偏小,唇色自然,表情克制,没有明显微笑。
•整体妆容为清淡自然妆:
•底妆轻薄
•眼妆干净,没有明显烟熏或夸张色彩
•唇妆偏裸色或淡粉色

⸻

三、发型与发质
•长直发,发色为偏暖的深棕色。
•中分发型,分缝笔直,左右对称。
•头发顺直、贴合,发尾自然垂落至腰部附近,整体显得柔顺、有光泽。
•发量看起来较多,线条干净,没有明显卷度。

⸻

四、服装细节
•穿着一件白色蕾丝连衣裙:
•无袖设计,露出肩部与手臂
•V 领或浅领口,领口处有精细的蕾丝花纹
•裙身贴合身体曲线,但并不夸张
•裙摆长度偏短,停留在大腿中上部
•面料为蕾丝+内衬结构,蕾丝纹理清晰,风格偏女性化、柔美。

⸻

五、姿态与肢体语言
•人物以侧坐姿坐在沙发上:
•上半身微微前倾
•一只手自然搭在沙发或毛毯上
•另一只手轻放在腿部
•双腿弯曲收拢,姿态显得放松而内敛。
•整体肢体语言偏安静、克制、略带亲密但不过分张扬。

⸻

六、光线与摄影风格
•使用的是柔和的棚拍或自然补光:
•光线均匀,没有强烈阴影
•面部和身体轮廓被柔化
•色温偏中性或微暖,突出肤色的细腻感。
•背景虚化不明显,但因背景简洁,人物自然突出。
•整体风格接近商业人像 / 时尚写真 / AI 或高精修风格。

⸻

七、整体气质总结

这张照片给人的感觉是:
•干净
•精致
•柔和
•带一点冷静与疏离
•偏“被观看”的人像美学,而非抓拍或纪实
2k分辨率
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 39.
  • 40.
  • 41.
  • 42.
  • 43.
  • 44.
  • 45.
  • 46.
  • 47.
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 54.
  • 55.
  • 56.
  • 57.
  • 58.
  • 59.
  • 60.
  • 61.
  • 62.
  • 63.
  • 64.
  • 65.
  • 66.
  • 67.
  • 68.
  • 69.
  • 70.
  • 71.
  • 72.
  • 73.
  • 74.

这是生成的效果:

第二个case:

提示词:
{
描述:一幅超逼真的 3D 等距视角杰作,描绘了一幅展开在光滑深色木桌上的魔法地图。地图绘制在一张古老而饱经风霜的羊皮纸卷轴上,但画面中的景色以立体模型的形式跃然纸上。巍峨的岩石山脉,白雪皑皑的山峰,穿透缕缕白云;一条蜿蜒的碧绿河流从中心流过;山麓覆盖着茂密葱郁的松林。羊皮纸边缘呈锯齿状,左侧饰有精美的复古书法,角落则绘有罗盘玫瑰图案。画面采用温暖的电影级光照,焦点清晰,纹理细节丰富,2K 分辨率,以奇幻冒险为主题。
"negative_prompt": "扁平的,2D 的,简单的图画,模糊的,低质量的,扭曲的,有水印的,糟糕的人体结构,文字叠加,颗粒感强的",
“参数”: {
"aspect_ratio": "2:3",
"风格": "电影级 3D 渲染",
"视图": "等距"
  }
}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.

生成的效果:

看起来ChatGPT Images指令遵循的要比NBR要强(人像),审美能力还不好说。

文章来自:51CTO

Loading

作者 yinhua

发表回复