今天凌晨1 点30 分,OpenAI 发布了全新的图像模型GPT-image-1 。此模型已通过API 向全球的开发者开放使用。
GPT-image-1 与GPT 版本存在显着差异,它能够对生成图像的敏感度进行控制,还能提升生成效率,同时可以设定背景,规范输出格式,提高渲染质量以及压缩质量等,并且还支持全网备受关注的吉卜力模式。当下,Adobe、Figma、HeyGen、Wix 等这些知名企业已经把该模型整合到了它们的产品当中。
需要注意的是,OpenAI 已针对新模型的API 采用了全新的身份验证方式。若无法通过验证的话,小伙伴们可以借助微软的Azure 云服务来进行体验。
详细API指南:
GPT-image-1应用案例
目前,有很多知名企业开始把GPT-image-1 模型运用到实际业务里。比如,多媒体方面的巨头Adobe 已经把它整合到了Firefly 和Express 应用中,以此给用户提供各种不同类型的图片风格。
云设计平台Figma 借助GPT-image-1,仅需简单提示,便可生成和编辑图像,从而能帮助设计师在Figma 中迅速获取想法并进行视觉迭代。
AI 视频平台HeyGen 正在利用GPT-image-1 以增强头像的创建工作,尤其在对平台内的头像进行编辑方面有所改进。
云开发平台Wix 借助GPT-image-1 能够协助所有用户迅速将他们的想法转化为实际的事物。
图像设计平台Photoroom 正在利用GPT-image-1 来协助在线卖家。它可以通过一张产品照片,迅速创建出工作室品质的视觉效果。同时,也能创建出生活场景以及模特照片。
GPT-image-1支持哪些高级定制
开发者通过API 所具有的最大特色在于支持对各种高级功能进行定制。比如,通常情况下我们利用GPT-4o 来生成图像时,一般只能生成一张。然而,通过API ,只需设置一个N 参数,便能够一次生成多张图像。
用多张图像当作提示词,比如,我们直接运用四张单独的图像,直接将它们合成一张完整的礼品新图像。
使用过Photoshop 来合成图片的小伙伴,应该都知晓一个很重要的功能,那就是蒙版。如今,通过GPT-image-1 也能够轻松地将其实现了。
阳光明媚的室内休息区有一个游泳池,游泳池里有一只火烈鸟,接着进行了蒙版涂抹。
最终输出的图像。
开发者能够更改图片的透明度,方法是把background 参数设定为transparent 。不过,这种方式仅对png 和webp 这两种输出格式提供支持。
此外,开发者能够借助API 来设置GPT-image-1 的图像尺寸,包括1024x1024、1024x1536 以及1024x1536 这些规格,还可以设置为自动;能够设置渲染质量,有low、medium、high 这三种;能够设置压缩格式,包括JPEG 和WebP 格式的压缩级别,范围是0 到100%。
所以,利用GPT-image-1 的API 去生成图片,其自由度是非常高的。它能够彻底把用户的想法释放出来,并且生成的图像也很不错。
定价方面,文本输入每100 万token 的价格是5 美元;图像输入每100 万token 的价格是5 到10 美元;图像输出每100 万token 的价格为40 美元。
在实际使用时,1024x1024 的低质量图像生成成本大概是每张0.02 美元。中等质量的图像,其成本约为每张0.07 美元。高质量的图像,其成本则约为每张0.19 美元。
OpenAI 的首席执行官以及联合创始人Sam Altman 对该模型给予了赞扬,并且表明它与GPT 版本存在很大的差异。
网友表示,这次API 的发布对于开发者而言具有重要意义。仅图像编辑这一功能,就能够开启诸多之前无法达成的创意应用场景。
这个模型太棒了!会取代DALL-E系列吗?
图像生成功能被集成了,如今这拓宽了API 用户的创意可能性。开发者们的应用在不断增加,这是令人期待的。这是一项引人注目的创新。
这很有意思! API 在底层给予了更多的控制能力。对于特定的应用场景来说,能够自定义审核敏感度,并且平衡质量与速度,这可能会带来变革。