首先是经典的猜图环节,提问:以下哪些照片是人工智能生成的? (答案在下面)
当我第一次在 Reddit 上看到这些照片时,我完全不敢相信。我真的无法区分真实感和我用 iPhone 在朋友身上拍摄的照片之间的区别。
在我的印象中,AI生成的图片仍然是“变形的手指”和“光滑到无毛孔的皮肤”。怎么已经进化到可以当“杀猪盘”的地步了呢?
我跟随社区的潮流,发现“AI摄影师”不知不觉已经成为一个新的行业。
如何生成“iPhone direct”图像
这些优质图片来自 Reddit 上的“r/stablediffusionreal”社区。发帖者是dal_mac,一位个人AI开发者。
红迪网
该社区致力于基于开源模型Stable Diffusion 生成逼真的肖像。肖像越真实,帖子的点赞度就越高。
这篇名为“iPhone现实主义”的帖子一发出,就越来越受欢迎。不仅引爆了社区,还蔓延到了Instagram、linkedIn甚至微博。很多人在评论区努力寻找AI的踪迹,直到屈服并求教。
比如下图,我差点就“瞎了”。我放大再缩小,然后我几乎看不到一些“不自然”的地方:
红迪网
· 本应放在侧面的门把手错位,放在了门的中间。
· 仔细看后脚的鞋带,断了。
如果你还发现什么,请“抓AI”,评论区见。
dal_mac 是如何做到的?他在帖子中提到了“Flux”。
Flux 是由 Stability AI 前员工于 2024 年推出的半开源文本生成图像模型。根据AI模型评估平台Artificial Analysis的分析结果,Flux.1在图像质量方面超越了Midjourney和OpenAI的DALL·E。
Flux 以其高保真图像生成功能而闻名。它因生成图像的“真实流畅”而被媒体批评,尤其是在 X 上,里面充满了 Flux 生成的名人 AI 图片,例如泰勒·斯威夫特和特朗普。他们都是它的“受害者”。
我还使用 Flux 生成了一张写实风格的照片,特别强调“像 iPhone 拍摄的一样自然、真实”。结果,手指肿得看不到关节,而手指又光滑得可以磨皮去除。到最大的皮肤,搭配过于模糊的背景(无处可称为“UNNIVEE LTL STUDIIC”)。
通量
是的,这就是我印象中的AI生成的肖像!
是的,微做
dal_mac 表示微调 Flux 模型。对于个人开发者来说,这种训练方式大大降低了数据需求和计算成本。但dal_mac表示,他花了两年的时间和多次测试才使用Flux将其微调到可以“真实”的程度。
dal_mac评论了目前市场上模型的生成效果。缺点是结果太准确(这里可能指的是细致的发型和完美无瑕的脸),肖像太完美。人们花钱去找专业摄像师,只是为了让自己看起来比平常好一点。现在已经好多了,好到失去了自然人的美。
经过dal_mac微调的“iPhone写实风格”模型,在原始图片中并没有浓烈的“AI味道”。图片有质感,人像没有P的那么完美,能顶住Instagram和小红书。网友们猜测的程度。
红迪网
不仅仅是dal_mac,r/stablediffusionreal作为一个整体也是一场竞赛,看谁能更好地“微调”。例如,继“iPhone Realism”之后,社区中又出现了一个热门帖子“2000s Analog Core”。
作者 Danrisi 还利用 Flux 微调模型生成了近乎完美的千年低像素风格照片。当我打开它时,我一度以为我正在打开挂在电脑上的 1.8 兆像素摄像头。
2000年代模拟核心丨Reddit
2000s Analog Core结合了VHS(家庭视频系统)和千年数码相机的效果,适合制作怀旧、低保真人像风格的图片。
Danrisi直接开源了自己的LoRa(直译为大语言模型的低级适配,更轻量级的微调,可以直接作为插件应用在AI图像生成中,具有类似相机的效果”滤镜”),使用起来比P图软件方便。您不需要真实的照片作为“底图”。你只需告诉人工智能你想要生成什么。
网友应用2000s Analog Core LoRa后生成的图片丨civitai
以这两人为代表,他们正在开辟一条“定制AI摄影”的新赛道。
客户向他们提供一张自拍照,并收到一个相册,其中模拟了在不同地点、风格甚至不同设备上拍摄的照片。
一开始的那组肖像就是这样产生的。
该帖子被转发并疯传后,linkedIn上有人质疑:dal_mac的这组照片一定是真人。
领英
dal_mac 自己解释说,她是她的客户之一,并使用她的脸部照片在模特身上运行了上面的照片。也就是说,这些照片是由人工智能生成的,但它们也是基于真实女性的脸部。他把这项服务称为远程摄影(我翻译为AI摄影)。
原作者的澄清
很难定义它是人工智能还是人类(“摄影师”)。
正当我想知道谁会购买这项服务时,我看到一条评论:“我想知道我是否应该为我的 linkedIn 获取一张专业照片。让我试试这个。”
授人以鱼不如授人以渔。 dal_mac 现在正在销售课程:教人们如何成为一名“AI 摄影师”。
真还是假,重要吗?
“旧的摄影世界刚刚被摧毁,这有好有坏。可能很难理解现实是什么了,但结果是惊人的。”有人在看到那些真实的照片后留下了这个。评论。
正是低像素、噪点和千禧气息,让画面失去了很多“流畅的AI感”,模糊了很多细节。相反,在人们眼中,它们有一种类似于偶尔被挖出来欣赏的老照片的真实感。感觉。
不知道你是否注意到,人类对于人工智能生成的肖像的态度已经发生了变化。过去,人工智能被认为不够真实,充满漏洞。现在我觉得AI太完美了,好得不自然,没有质感。
人工智能生成的视觉效果的保真度确实向前迈出了一大步。这使得人类对虚假与现实的判断之间的过渡地带变得更窄,界限变得模糊是很常见的。
一位 AI 工程师在 DuckDuckGoose AI 上测试了 dal_mac 生成的图像,没过多久就确认了:它确实是由 AI 生成的。
pi-labs.ai 官方也回复称,“我们使用 DeepFake 检测工具 Authentify 扫描图像,显示该图像是使用 AI 合成生成的。”
pi实验室
换句话说,人是真的,照片是假的。假照片是由真人制作的,但假照片看起来很真实。 (那什么是真的?你说什么是真的?)
dal_mac 的原帖中还有一张相对“边缘”的图片。后来,有网友利用图胜视频模型,将边界图片制作成了边界视频。即使dal_mac获得客户授权,麻烦也会由此而来。这应该归咎于谁?
于是大家又开始讨论AI的伦理问题。一些人呼吁在相机中内置数字签名,将来可以用来验证“实拍”或“生成的图像”;有人表示,公民肖像权益应当受到保护,特别是女性照片不能用于擦除。侧面、色情内容;当然也有躺着的,说新一代手表的一切都是“先入为主”……
事实证明,这最后的“真相”不无道理。人们虽然分不清真假,但总能成功地被“情绪”冲昏头脑。
今天,dal_mac 原始帖子的最高点赞数(除了澄清评论)如下:
“如果我告诉你,这不是人工智能。这个女孩是真实的。我读过一篇文章,她在照片中认出了自己,并起诉了原作者。”
这时候你需要点击“展开”来阅读下面的段落。
“我上面说的不是真的,是我编造的。不过你刚才就信了对吧?无论人工智能还是人类,网络上的‘真实’到底是什么?既然我们总是盲目地吞下去”为什么要这样现在让我们担心吗?”
也许人工智能给我们带来的辨别真假的困难不是技术问题,而是……哲学问题?
回到文章开头的投票,正确答案是:ABCD。