随着人工智能成像变得更加先进,从拍摄的场景中辨别真实情况变得越来越困难。这在很多方面都会成为一个问题——从假新闻到真实人物的深度伪造。
我们唯一的机会就是更加敏锐地识别假货。
我最近进行了在线人工智能识别,能够从人造版本中正确选择所有真实图片。(从DALL-E开始,我已经尝试人工生成的图像一年多了。)但是人工智能输出变得如此先进,以至于现在它们正在愚弄所有人。
我看过一些 Instagram 摄影账户,我可能无意中关注了人工智能图像。人工智能一代实际上赢得了摄影比赛,因此它开始愚弄业内应该更了解的人。
真实与人造正在融合在一起
显然,这是令人担忧的。信息是宣传的武器,人们并不总是对他们所看到的事物运用批判性思维技能——尤其是当他们有预先存在的偏见时。
例如,如果您相信大脚野人是真实的,那么您更有可能接受人工智能生成的大脚野人图像为合法:
作者使用 Midjourney 提供
不可否认,这看起来很有说服力。灯光具有逼真的品质,大脚野人看起来也很真实——我们确实没有太多可以与之比较的地方。
这是你必须质疑的不仅仅是视觉细节的地方。问自己这样的问题:摄影师会离得那么近吗?在之前的报道中,大脚野人看起来很害羞,但它会如此大胆吗?
虽然它们变得越来越难被发现,但有几种方法可以将人工智能图像与现实分开。这是一个简短的视觉指南,其中包含需要注意的细节。
肖像
作者使用 Midjourney 提供
这一代的中途女人,愚弄了很多人。戏剧性的灯光增加了深度和质感,这可以欺骗眼睛,让其看起来像真实的一样。
不过仔细一看,你会发现皮肤纹理太完美了。毛孔看起来太小而且靠得很近。你还会发现许多人工智能肖像的皮肤是完美无瑕的——大多数人都有瑕疵、痣、粉刺和其他识别特征。
这是两个女孩拥抱的另一张肖像。哇哦,看来大姐姐对小妹妹有些关爱呢。
作者使用 Mage.Space
乍一看,我觉得它很真实。女孩们的皮肤上甚至有一些痣,模糊的背景让它看起来像是专业人士拍摄的
但少女耳后到底是什么?我猜想这可能是她太阳镜的镜腿,但它不合适。
人工智能经常会以稍微奇怪的方式放置时尚配饰,比如与耳垂不太连接的耳环——这是一种赠品。
过去,通常是手来提醒观众注意假货(多余的手指或不可能的手位置)。现在,人工智能模型已经过微调,可以非常逼真地再现手,因此它们不再是唯一的线索。
宠物
我要求 Midjourney 为这两个可爱的毛茸茸的朋友提供真实的渲染,而不是它有时默认的可爱的卡通版本。结果非常令人信服——更不用说,还很可爱。
作者使用 Midjourney 提供
然而,正如您在放大版本中看到的那样,纹理几乎是绘画般的。“笔触”显得柔和,没有硬阴影。简而言之,它太完美了,不太真实。
除此之外,有多少狗和猫会如此平静地并排摆姿势,并留出足够的时间来拍照?我猜不会太多。
复古街景
我喜欢街头摄影,包括伟大人物的复古街头摄影。
考虑到这一点,我要求 Midjourney 制作 1950 年代的黑白街景,并带有胶片颗粒效果。我可以轻松地在上面添加白色装饰边框和日期戳(当时很常见),使其看起来更加真实。然而,它本身看起来很真实。
作者使用 Midjourney 提供
不管怎样,虽然这个场景无需仔细检查就可以被接受,但我注意到了一些事情。首先——假设这张图片应该出现在美国的任何地方——这辆车缺少后车牌,这几十年来一直是强制的。
另外,请特别注意城市图像中的任何店面或标志 - 如果文本看起来没有意义(或者显然不是另一种语言),则它可能是生成的。
顺便说一句,背景中的这些车辆似乎是近几年的车辆,而不是 SUV 还不存在的 20 世纪 50 年代。
有文字的场景
更进一步地讲,这是另一个包含单词的人工智能场景的例子——报纸和地铁广告。
作者使用 Mage.Space
正如您特别从报纸标题中看到的那样,它似乎不是英语(或任何公认的语言)。该脚本看起来像是由幼儿抓出来的。您还会注意到首页上的照片看起来不连贯。
文字是识别人工智能赝品的最佳方法之一,因为到目前为止,平台很少添加任何有意义的文字。
如果可疑图像中有文字,请先查看它们。(顺便说一句,在后期制作中添加文本比尝试生成准确的单词更有说服力。)
战争
现在正在发生重大冲突,我相信你们通过阅读新闻都清楚地知道了这一点。然而,在战争中,通过伪造图像作为宣传手段的风险也很高。
例如,政府或新闻机构可以发布不真实的压迫图像,以获取更多支持或煽动愤怒。
作者使用 Midjourney 提供
这个特殊的场景充满戏剧性和情感,因此大脑可能会直接跳过一些更精细的细节。然而,从特写镜头中你会看到士兵们携带的一些物品不太容易辨认。(左边的士兵拿着的是铲子?还是马桶刷?)
另外,当你看到战争照片时,问问自己:战斗发生在哪里?士兵的制服/和/或头盔是否与所涉及的国家相匹配?
有些摄影师冒着生命危险来揭露当今世界的恐怖,我为他们鼓掌。它们是人工智能无法替代的。
城市景观
正如您从老式街景中看到的那样,人工智能可以处理的不仅仅是人和宠物。这些平台还可以忠实地再现城市天际线,以及可识别的建筑物。
这是距离我一小时车程的多伦多之一:
作者使用 Midjourney 提供
请注意加拿大国家电视塔和天穹(罗杰中心),它们都是霍格敦景观的标志性部分。
对于下一个示例,我生成了一个通用的城市景观(没有特定的地方)。由于可以自由地创建它想要的任何天际线,Midjourney 生成了以下内容:
作者使用 Midjourney 提供
我喜欢这座城市的现代面貌,而这种面貌并不存在。起初我以为可能是迪拜,那里也有现代的玻璃结构。然后我想这可能是塞浦路斯的利马索尔——但又不完全是。
因此,在验证城市照片时,识别关键建筑物显然很重要。确保它们在任何反射中都是一致的,就像在这个反射中一样。
然而,如果我们仔细观察,这张人工智能图像中还有其他线索。例如,左边圈起来的那个东西到底是什么?起初我以为那是一台起重机,或者某种灯光装置。
事实上,中途想象中的城市里可能会出现这样的垃圾。
名人
谁不喜欢名人照片?有些人靠在野外拍摄名人为生,我怀疑狗仔队会试图向新闻媒体出售赝品(如果他们还没有这样做的话)。
人工智能可以很容易地产生名人并将他们安置在他们想要的任何地方,包括可能会给他们带来麻烦的地方。
这是比尔·默里在人群中随意挥手的一张照片:
作者使用 Midjourney 提供
我毫不怀疑他会穿成这样,或者留着小胡子。环境看起来也有点像他居住地查尔斯顿。
然而,你可以看到这张照片中他的皮肤太完美了,不太真实。更不用说,穆雷已经 73 岁了,他的笑点比这部剧还要多。我觉得他的鼻子也有点不对劲——并不是说有什么问题,而是与真实的鼻子不太相符。
比尔·默里(维基百科)
与此同时,我们还有因《白莲花》和《幸福感》而闻名的美丽的悉尼·斯威尼。我什至在 mage.space 中应用了一个特殊的 Sydney Sweeney“图层”,它可以让你模仿各种各样的名人。
作者使用 Mage.Space
虽然有点令人信服,但你会注意到人工智能版本中眼睛的视角有些奇怪,这会让我多看两眼。
这是她的真实照片(我认为):
悉尼·斯威尼
提高你的人工智能识别技能
现在您已经了解了在真实图像中识别人工智能图像的多种方法。这是一项会派上用场的技能,特别是如果你从事的职业依赖于区分事实与虚构。
让我们回顾一下识别假货的一些关键方法:
• 拍摄对象的皮肤是否过于完美,没有任何瑕疵?
• 他们的头发看起来是否太完美,好像是用刷子画过的?
• 时装/配饰是否显得格格不入或来自不同时代?
• 图像中的文字对于任何可识别的语言都有意义吗?
• 建筑物和当地服饰是否与图像背景准确匹配
• 场景本身极不可能发生,尤其是当它是“独家”报道时(例如,仅来自一个新闻来源的外星人登陆照片?)
随着我们的前进,确定什么是真实的只会变得更加困难,但至少现在我们可以领先机器人一步。
是的,其中一些将归结为批判性思维,而近年来,批判性思维一直非常缺乏。然而,您应该能够使用所有这些技巧来识别冒名顶替者——至少现在是这样。