旗下矩阵

  • 投资界
  • 天天IPO
  • 解码LP
  • 并购
  • 前哨
  • 投资界AI

GPT-Image-2正式发布!设计师可以告别「古法设计」了

GPT-Image-2正式发布,官方称其为ChatGPT Images 2.0。实测效果超棒,已全量上线,在大模型竞技中登顶第一,领先第二名Nano Banana 2 240分。
·微信公众号:量子位关注前沿科技

AI投资人解读

· ChatGPT Images 2.0是OpenAI首个具“思考”能力的图像模型,能处理复杂任务,在多方面表现强大,如生成商品广告、论文海报等,还支持多种玩法。它在大模型竞技场上登顶第一,断层领先第二名。已全量上线到相关平台,给出了API价格。
· 生成文字有小瑕疵玩法可能存在违规风险。
总结:ChatGPT Images 2.0技术优势明显,应用场景丰富,具备投资潜力,但需关注其文字生成瑕疵及玩法合规性等风险,可结合市场需求与竞争态势进一步评估。内容由AI生成,仅供参考

比Nano Banana更超神的GPT-Image-2,刚刚正式发布!

请注意,这不是截图,这不是截图:

输入提示词“生成一张和GPT的对话截图”,你就能得到:

官方给出的产品正式名称是ChatGPT Images 2.0

细看1分49秒的宣传片,会发现这个全新图像生成模型,真的能让很多复杂的工序变成一句话+几秒钟就能搞定的事……

这一回,设计师们真得好好规划一下设计领域的“Vibe Coding”时代了……

实测:简单Prompt,*效果

官方介绍,ChatGPT Images 2.0是OpenAI*具备“思考”能力的图像模型。

Thinking能力的加入,使得模型可以处理更复杂的任务,在准确性、时效性、一致性和视觉连贯性上有更加强大的表现。

中译中就是,以假乱真不费劲,并且是真·生产力工具。

关于ChatGPT Images 2.0有多乱真,我们再做个简单测试:

1,2,3……

左边是ChatGPT Images 2.0生成,右边是真实页面,*眼看,你猜对了吗?

尽管在生成文字上还是出现了小瑕疵,但在颠覆设计工作流这方面,不得不说GPT-Image-2在Nano Banana之后,又把历史进度条往后拖了一大截。

下面,我们就进入更真实的生产力场景。

商品广告

量子位最近刚好在迭代周边T恤的版本,直接把这个工作交给ChatGPT Images 2.0,来看看它的完成度如何。

提示词:为科技自媒体量子位设计定制T恤,生成宣传图

图中中文文字不少,但还真一个没出错。并且在没有补充量子位背景信息的情况下,从logo到定位,ChatGPT Images 2.0看样子都自己联网把信息收集到位了

论文海报

再提升一点复杂度,直接抛给ChatGPT一篇论文,让它解读完生成对应的宣传海报。

这样复杂的长图,ChatGPT Images 2.0同样是在短短一句话的提示词下,一次性成功输出了。

并且有了联网搜索能力的加持,某些场景中,用ChatGPT Images 2.0生成类似信息量丰富的海报、卡片,甚至能省去自己搜集资料这一步。

比如,“生成关于原神玩法的推荐海报,官方设定风格”。

更多玩法

当然,如果再开开脑洞,ChatGPT Images 2.0还可以实现更多离谱玩法。

比如,生成作业……

它可不是乱给答案的,不信你算……

(妈妈再也不用担心我的作业不够写)

网友们探索出的玩法还有,生成360度照片

奥特曼本人也po出了ChatGPT Images 2.0制作的团队故事4格漫画。

这么实测观察下来,官方的总结并非吹牛不打草稿,确实是有那么点“我OpenAI又杀回来了”的气势在:

为图像生成带来了划时代的细致度和保真度。在API中,ChatGPT Images 2.0最高支持生成2K分辨率的图像。

具备更强的多语言理解能力。

支持最宽3:1、最窄1:3的图片比例。

引入更新的世界知识,知识截止时间为2025年12月。

一次提示最多可生成8个输出,并且图中的角色和物体能保持连续性。

另外,在大模型竞技场上,ChatGPT Images 2.0已登顶*,并且在文本到图像任务中,断层*第二名Nano Banana 2 240分。

Image

现在, ChatGPT Images 2.0已全量上线到ChatGPT、Codex和OpenAI API中。API具体的价格如下:

GPT-Image-2背后研究团队

这次ChatGPT Images 2.0发布,奥特曼身旁又是一水儿东方面孔。

研究团队的Leader是Gabriel Goh,他博士毕业于加州大学戴维斯分校数学专业,2019年从苹果离职后加入OpenAI。

出镜的几位中依然少不了华人。

陈博远,江苏人,OpenAI研究科学家,本科毕业于伯克利,后于麻省理工取得博士学位。

他的研究侧重于世界模型、具身智能和强化学习。而在研究之余,他还是一位热爱珍珠奶茶的大厨。

One More Thing,根据陈博远的个人主页信息,GPT图像生成模型团队的人数看上去并不多:

我是为数不多的从事训练GPT图像生成模型的研究者之一。

参考链接:[1]https://openai.com/index/introducing-chatgpt-images-2-0/#textmode[2]https://x.com/OpenAI/status/2046670977145372771

【本文由投资界合作伙伴微信公众号:量子位授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。