发布信息

从面目全非到栩栩如生:12年间AI猫脸图像的惊人演变

作者:软荐小编      2024-12-06 14:02:12     72

2012 年,计算机科学家 Andrew Ng 和 Jeff Dean 进行了一项实验。

他们使用了16000个CPU、1000万张猫图片以及当时世界上最大的深度学习网络训练了3天,生成了世界上第一张AI猫脸图像。这是人们基于深度学习模型自动生成图片的开始。由于当时的技术能力,图中的小猫“无法辨认”。

十二年后,当网友第一次看到黑猫白色翅膀的照片时,几乎所有人都认为这是一张真实的照片。

毕竟,宠物博主给自己的猫咪装上翅膀配件,然后用胶片相机拍照记录下来,这并不罕见。直到看到帖子底部的“AIGC”标签,人们才惊讶地发现:“这居然是AI生成的?”

让一让,全球最鲜活的AI小猫来了_让一让,全球最鲜活的AI小猫来了_

12年前的AI小猫 vs 12年后的AI小猫

怀着极大的好奇心,越来越多的网友顺着网线来到了一款名为“Recraft AI”的应用程序,尝试生成自己理想中的小猫。

局势失控了。

连日来,各类“小猫片子照”充斥小红书、抖音等社交平台的信息流。无论是拿着红酒杯的小猫,敲击键盘的小猫,还是拿着魔杖施展咒语的小猫,都是Recraft AI的杰作。

近年来,在AI领域的所有发展中,最贴近普通用户的就是AI生成的图片。

自从2021年初OpenAI发布DALL-E大型模型以来,AI已经能够通过文本生成图像。三年内诞生的AI图像生成工具一波又一波地进化迭代。专注于技术能力突破的有稳定扩散、中途、FLUX等,专注于C端应用的有妙芽相机、Remini等。

从最初追求极致的“形象”,到现在逐渐厌倦AI的味道,开始追求风格和审美,这一代网友正在将Recraft AI推上新的“神坛”。

没有AI味道的“造梦AI”

这次流行的其实是“Hard Flash”,一种内置于 Recraft AI 中的预设风格。

该模式可以模拟胶片摄影时打开闪光灯后的拍摄效果。生成的图片主体突出、对比度高、色彩饱满丰富。目前,AI网站允许免费用户每天赚取50积分并生成50张图片。虽然中文提示词的生成效果仍然不如英文,但Recraft支持直接输入中文密码。

_让一让,全球最鲜活的AI小猫来了_让一让,全球最鲜活的AI小猫来了

如果说ChatGPT的出现让作者焦虑,中途的出现让画家悲伤,那么这一次,恐慌的是摄影师。

小红书是Recraft最先引起国内用户关注的地方。目前,相关主题的注释已超过 10,000 条。

其中,不乏摄影爱好者感叹“我宣告摄影不再存在”;也有专业的电影摄影博主,在看过Recraft生成的图片后,认为AI的构图、色彩、美观都非常出色,开始思考还有什么。这是人类摄影师可以掌握的东西;甚至有人开始研究Recraft的配色和构图,试图进行“逆向学习”。

_让一让,全球最鲜活的AI小猫来了_让一让,全球最鲜活的AI小猫来了

来源:小红书

虽然其他AI工具的画风更细腻,生成的图片更漂亮,但看久了难免有一股“AI味”。

无论是不和谐的色彩过渡、不自然的结构;或过于光滑整齐的轮廓,或完美无瑕的纹理,总之,早期“一见钟情”的AI,现在也太逼真、完美无瑕了。有点AI的味道。

面对众多追求细节、力求写实的AI绘画工具,强烈而鲜明的视觉风格是Recraft成功的关键。

刺猬公社(ID:ciweigongshe)尝试了几种不同的模型,并输入了相同的密码“很多动物”。从最终生成的结果来看,Recraft内置的Hard Flash模式乍一看确实有不一样的感觉。

Recraft没有像FLUX或DALL·E 3那样的常规构图,而是将不同的动物排列成一排。画面中大片的空白土地和天空似乎给画面增添了一种不同的意境:这是一头孤独的狮子。

让一让,全球最鲜活的AI小猫来了_让一让,全球最鲜活的AI小猫来了_

从左到右由 Recraft、FLUX 和 DALL·E 3 生成。

当AI生成的图像能够传达情感时,Recraft AI也被贴上了“梦芯”、“怪异”的标签,越来越多的网友开始激发自己的创作欲望。

有些人将自己喜欢的电影台词或歌词作为密码输入到 Recraft 中,预测会生成什么屏幕。

在一篇有1.6万个赞的小红书笔记中,博主“范”将“太空探索编辑部”的台词输入到Recraft中。虽然生成的图片无法100%复制台词内容,但整体画面风格简直就是“比太空探索编辑部还太空探索”。

有些人还尝试用Recraft来记录自己的梦想或表达难以形容的情感。一些热心网友整理了常用的提示词,可以帮助Recraft生成更加空灵梦幻的画面。有网友甚至发现了新的商机,帮助不能使用Recraft的用户生成梦想核心图,一张图几块钱。

_让一让,全球最鲜活的AI小猫来了_让一让,全球最鲜活的AI小猫来了

来源:小红书

在网友的热情参与下,继妙芽相机、雷米尼粘土特效之后,又一波AI狂欢又掀起了。每个人似乎都想亲自尝试一下,向AI输入一个“咒语”,生成一幅充满想象力的画面,达到一种“魔法成真”的奇妙感觉。

于是,最近小红书、抖音等社交媒体平台似乎被“魔法”包围:Hello Kitty站在窗边看烟花,小狗在雪地里吃蛋糕,金鱼在蓝天飞翔…… 。

11月25日,小红书官方技术站还推出了专场活动。用户使用Recraft创建图片并发布相关主题的笔记,将有机会被推送。

在社交媒体的推动下,微店数据显示,近一周《Recraft》在国内App Store的下载量已跃升至“图形与设计榜”第二位。

让一让,全球最鲜活的AI小猫来了_让一让,全球最鲜活的AI小猫来了_

AI黑马的背景是什么?

虽然Recraft AI俘获了一大批国内网友的心,但事实上,这种模式既不能体现也不能代表Recraft AI的技术实力。

在很多经常使用AI绘图工具的用户看来,现有的很多大型AI绘图模型都可以通过输入密码实现类似电影的效果。

真正证明Recraft AI实力的,是今年发布的Recraft V3模型。

在Recraft V3模型正式公布之前,Recraft AI在Artificial Analysis网站上以化名“小熊猫”参与AI图像赛场投票,并获得AI图像赛场第一名,一举超越了 FLUX、Midjourney、Ideogram、Stable Diffusion 3.5。图像电路中的一匹黑马。

_让一让,全球最鲜活的AI小猫来了_让一让,全球最鲜活的AI小猫来了

由于“小熊猫”这个名字,很多人最初猜测该模型背后是否有一家中国公司。直到今年 10 月 Recraft AI 在 Twitter 上认领该模型后,人们才开始关注。这家AI公司已经成立两年了。

Recraft AI 成立于 2022 年,是一家总部位于英国的初创公司。

创始人兼首席执行官安娜·维罗尼卡·多罗古什(Anna Veronika Dorogush)曾在谷歌和微软从事软件工程工作,后来加入俄罗斯最大的搜索引擎平台Yandex,是CatBoost开源梯度boost库的创建者。

今年1月,Recraft AI获得由美国风险投资公司Khosla Ventures领投的1100万美元A轮融资,GitHub前CEO Nat Friedman也参与其中。主要用于加速技术研发和市场拓展。

让一让,全球最鲜活的AI小猫来了_让一让,全球最鲜活的AI小猫来了_

由于国内用户大多通过社交媒体上传播的“硬闪”模式了解到Recraft AI,因此人们常常误认为它是Midjourney这样的AI图像生成公司。

但了解之后你会发现,Recraft AI 的初衷始终是“专注于为平面设计师提供 AI 辅助工具”。因此,相比Midjourney,它其实更像是AI版的Cavan或者Photoshop。

就连排名靠前的Recraft V3模型,也在一定程度上经过了Recraft AI的训练,以方便设计师生成海报。

在介绍Recraft V3模型的官方博客中,该公司声称该模型是“图像生成领域唯一可以生成长文本内容的AI图像模型”。

让一让,全球最鲜活的AI小猫来了__让一让,全球最鲜活的AI小猫来了

例如,如果设计师需要在海报上显示大量的文字内容,之前的AI生成图像模型很容易在文字内容中出现拼写错误,因此设计师的正常做法可能是先使用AI生成的图像来生成海报的背景。图片,然后使用其他工具添加文字内容。

Recraft V3模型的逻辑是通过提高AI直接在图像中渲染文本内容的准确性来简化设计师使用AI生成海报的流程。 AI媒体“新智元”曾在文章中解释过该模型的运行机制:

在构建文本信息的过程中,Recraft团队使用了TextDiffuser-2表示方法。每一行文本首先记录文本的内容,然后用坐标来表示文本的具体区域。但与 TextDiffuser-2 不同的是,Recraft 使用三个坐标点来表示文本,从而使模型支持渲染倾斜文本。

总之,结果就是设计师在Recraft V3的帮助下,可以大大提高海报中文字内容的生成效果和控制力。

让一让,全球最鲜活的AI小猫来了__让一让,全球最鲜活的AI小猫来了

除了AI生成的漫画风格、写实风格、电影风格、矢量图形、插图、图标和3D图像外,Recraft还提供套索、部分重画、剪纸和模型等设计工具。

体验过后,最让刺猬公社设计同事惊讶的就是样机功能。借助AI能力,Recraft AI可以自动将图案或图标贴合到产品图片上,并直接生成产品样本,省去了设计师手动调整参数的麻烦。此外,Recraft还引入了实时协作功能,同一项目的设计师可以在无限画布上对生成的内容进行评论并实时修改。

理解模型还不够,还需要理解内容

虽然目前看来80%的国内用户并没有像创始人设想的那样使用Recraft AI作为AI设计工具,但Hard Flash的流行也并非坏事。

从AI生成图像领域的历史来看,过去三年绝对是赛道上各大厂商竞争最激烈的时期。大家都在争先恐后地更新大型模型,生怕一不小心就落伍了。

2021年初,OpenAI发布了DALL-E大模型,可以让AI通过文本生成图片;

2022年3月,Midjourney上线,可根据用户输入的文字快速生成高质量图像;

2022年8月,Stable Diffusion正式开源,通过将随机噪声转换为高保真图像,实现从文本到图像的生成;

2024年8月,黑森林实验室推出了FLUX模型。其图像质量、文本理解和细节表现都超越了Stable Diffusion 3和Midjourney,成为该领域新的领导者......

到了10月份,人们讨论的主角很快就变成了Recraft。

据Recraft AI官方数据显示,Recraft V3模型发布20天后,该应用全球累计注册用户已突破200万。每次他们注册和登录时,Recraft 都会询问用户“他们是如何听说该应用程序的”。创始人 Dorogush 表示:“几乎所有的增长都来自社交媒体和用户的口碑。 ”

让一让,全球最鲜活的AI小猫来了_让一让,全球最鲜活的AI小猫来了_

重塑AI一代

这背后隐含的变化是,随着AI生成图像工具逐渐走进普罗大众的生活,AI公司想要成功,仅靠模型力量可能还不够。正如Dorogush在接受采访时所说:“生成高质量的AI图像还不够,(产品)还需要构建一些能够吸引人们注意力的东西。”

过去一些主要针对消费端的AI产品实际上已经证明了这一点。

比如去年在网络上火爆的秒芽相机,以及今年上半年火爆的Remini。这两款产品,一款瞄准“AI拍照”,一款打造“粘土特效”。两者都凭借其代表性的产品功能。 ,只为在用户心中留下不可替代的产品标签。

对于Recraft AI来说,硬闪带来的电影感是其冲出社交媒体圈、在更多用户心目中形成认可的“把柄”。

_让一让,全球最鲜活的AI小猫来了_让一让,全球最鲜活的AI小猫来了

重塑AI一代

在众多力求画面细节和真实感的AI模型中,Recraft出人意料地切入了允许无理取闹的“想象力”轨道。

一方面,统一的滤镜风格加深了普通用户对该应用的记忆,让Recraft这个名字在人们心中扎根。另一方面,这也非常巧妙地掩盖了AI模型能力的一些缺陷。即使生成的人物充满塑料感,画面总是以彩色幕布为背景,但在“梦芯”和“怪异”风格标签下,一切都变得合理。

AI企业不断追求技术能力的突破,这自然仍是当前AI发展阶段的重中之重。但如果想要带领更多普通用户进入AI时代,或许除了突破AI技术之外,还需要进一步降低使用门槛,选择合适的产品定位和营销策略。只有这样,才能有越来越多用户的AI产品“飞进寻常百姓家”。

相关内容 查看全部