Stable Diffusion被爆包含性别、种族歧视!比AI更可怕的是人类的偏见......

news2024/11/24 12:09:06

图片

夕小瑶科技说 原创
作者 | 付奶茶、王二狗最近,华盛顿邮报的一篇报道引起了“奶茶”我的关注!

报道中提到AI图像生成器已经开始暴露出它们学到的偏见。比如将非洲人刻板地视为原始,将领导者默认为男性,将囚犯一般视为黑人。

为了探究真相!

“奶茶”我用Stable Diffusion试着生成了一些图片:

图片

图片

相信大家都发现了!

Stable Diffusion生成的四张科学家照片全都是西方白人男性!

而生成的做家务的人物形象全部都是女性!

以及“奶茶”我最关心的下面这个💰💰问题:生成的结果也都是西方白人男性!

图片

还有下面👇🏻这个非常过分的偏见!

图片

图像生成器的有色眼镜

关于图像生成器带有偏见的问题,华盛顿邮报的记者连线了Stable Diffusion公司首席执行官Emad Mostaque。

Emad Mostaque提出,他们认为数据的透明度是审查和消除偏见的关键,所以他们已经在最新的模型中投入过了大量审查、干预措施以及更“干净”的数据,用来减少“偏见”。

然而,这些努力似乎未能阻止Stable Diffusion生成带有刻板印象的图片。在最新的测试结果中,它会将刻板印象和偏见转移到基本对象上,比如玩具或住宅。例如,当我们要求Stable Diffusion XL为不同国家生成房屋时,它会根据每个地点的“刻板印象”来生成图片:

对于中国,它生成了传统的弯曲房檐的房屋,而不是上海的高层公寓;

对于美国,它生成了理想化的独栋别墅,并带有修剪整齐的草坪和宽敞的门廊;

对于印度,它生成了尘土飞扬的黏土建筑。

图片

当被要求生成不同国家富有的人的照片时,Stable Diffusion XL仍然生成了一堆刻板印象:

穿着西方外套的非洲男子站在茅草屋前 中东男子站在古老的清真寺前 而穿着修身西服的欧洲男子漫步在古朴的鹅卵石街道上。

图片

性别偏见也会暴露在图像生成器的测试中。当我们提示系统生成“足球”的图像时,Stable Diffusion XL默认会生成大多数皮肤较深的男性运动员:

图片

但当要求生成“清洁”行为时,它只会生成女性:

图片

除了有关种族、阶级、性别、财富、智力、宗教和其他文化的刻板印象外,这些图像中所描绘的种族差异比现实世界中更为极端。

例如,根据美国人口普查局的收入和计划参与调查的最新数据,2020年,63%的食品优惠券受领者是白人,27%是黑人。但是生成结果完全相反:

高收入职位如“软件开发员”,生成的图像中白人和男性的比例要高于劳工统计局的数据;“有生产力的人”,生成的图像普遍是男性,以白人为多数,穿着适合企业职位的西装。

图片

不仅Stable Diffusion的生成的图片暴露了这样的问题,OpenAI最近发布的文件中也同样提到,DALL-E 3也呈现出了“倾向于西方观点”。

但是,如果了解图像生成器的训练原理,我们明白这样的生成结果既不反映真实世界也不反应作者意识,它来自于训练技术所使用的数据。

因此,当我们换一种视角来看待这样的偏见:

图片

也许这些偏见本身并无恶意,但它们却揭示了我们在现实生活中存在的偏见将随着互联网数据的不断积累用于大模型的训练,这些偏见似乎无限地延续下去。

大模型研究测试传送门

GPT-4传送门(免墙,可直接测试,遇浏览器警告点高级/继续访问即可):<br>
[http://hujiaoai.cn](http://hujiaoai.cnm)

背后原因:AI只是人类偏见的放大器

这个问题在很早之前已经种下种子。

ImageNet数据集在2009年建立,其中包含了超过1400万张图像,而研究人员在使用该数据集十多年后才发现其中存在令人不安的内容。这些内容包括非自愿的性行为图像,以及一些图像被归类到了一些具有侮辱性词语的类别中,比如“同性恋”,“失败”,“混血儿”,“非人”,“变态”和“精神分裂症”。尽管ImageNet的作者已经消除了大多数这些类别,但许多现代的数据集仍然以相似的方式构建。

清洗训练数据和建立干预措施可以改善这个问题吗?

目前,科技公司在处理图像训练数据方面的努力主要集中在一些干预措施上,包括筛选数据集、精细调整最终开发阶段,以及编码规则以避免引起公司负面影响的问题发生。

举例来说,当请求生成“Latina”图像时,Stable Diffusion生成了女性衣着稀少甚至几乎裸露的图像,而在最新的2.1版本生成了更无害的图像。《华盛顿邮报》根据这个案例进行分析发现,第一个版本的训练数据中包含了更多的色情内容。在带有“Latina”标题的训练图像中,有20%的标题或URL包含淫秽词汇。超过30%的图像被LAION的不适合工作内容检测器标记为“不安全”。而在随后的版本中,训练数据排除了被标记为可能“不安全”的图像,使得生成的图像看起来不那么性感。

可是科技公司目前使用的解决方案,只能避免生成带有明显危险以及潜在争议的图片,根本无法解决图片生成中的暴露的偏见问题。

因为究其根本,AI只是人类偏见的放大器!

小结

图像生成器基于训练数据来呈现事物的,与在文本中减轻偏见相比,要创建一个无偏见的图 像更加艰难。任何提示都必须对年龄、身体、种族、发型、背景和其他视觉特征做出决策,然而,这些复杂性很少能够通过计算来解决。因此简单的数据清理和危险数据屏蔽不能从根本上解决这个问题。

此外,随着AI生成的图像在互联网上传播,它们可能会继续赋予新的训练数据刻板印象和偏见,将关于体型、性别和种族等刻板印象编码到图像合成的训练数据中,这些刻板印象的影响将继续存在。

AI训练数据毕竟取材于现实,如果人类的真实世界中一直还存在着偏见,那AI也将“近墨者黑”~

欢迎各位读者在评论区分享自己的看法,一起讨论这个问题~

图片

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1184118.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

内衣专用洗衣机怎么样?家用小洗衣机推荐

最近这两年在洗衣机中火出圈的内衣洗衣机&#xff0c;它不仅可以清洁我们较难清洗的衣物&#xff0c;自带除菌功能&#xff0c;可以让衣物上的细菌&#xff0c;还能在清洗的过程中呵护我们衣物的面料&#xff0c;虽然说它是内衣洗衣机&#xff0c;它的功能不止可以清洗内衣&…

基于YOLOv8与DeepSORT实现多目标跟踪——算法与源码解析

一、概述 "目标跟踪 (Object Tracking)"是机器视觉领域中的一个重要研究领域。根据跟踪的目标数量&#xff0c;可以将其分为两大类&#xff1a;单目标跟踪 (Single Object Tracking&#xff0c;简称 SOT) 和多目标跟踪 (Multi Object Tracking&#xff0c;简称 MOT)…

『 MySQL数据库 』数据库基础之库的基本操作

文章目录 库的操作创建数据库字符集与校验集那么该如何查看当前数据库默认的字符集与校验规则?查看数据库所支持的字符集与校验集不同字符集(校验集)之间的区别 基本操作查看数据库显式数据库创建语句数据库的修改数据库的删除数据库的备份检查连接 库的操作 创建数据库 CRE…

记一次 Android 周期性句柄泄漏的排查

滴滴国际化外卖 Android 商户端正常迭代版本过程中&#xff0c;新版本发布并且线上稳定一段时间后&#xff0c;突然触发线上 Crash 报警。 第一次排查发现是在依赖的底层平台 so 库中崩溃&#xff0c;经过沟通了解到其之前也存在过崩溃问题&#xff0c;所以升级相关底层 so 版本…

家居品牌怎么做小红书投放,寻找家居达人的方式有哪些?

在当今社交媒体的时代&#xff0c;找到优秀的家居博主并不困难。但是&#xff0c;在找家居行业博主的时候&#xff0c;了解家居行业特性就很重要&#xff0c;今天来为大家分享一下家居品牌怎么做小红书投放&#xff0c;寻找家居达人的方式有哪些&#xff1f; 一、家居行业特性 …

共享盘的文件删除后能找回吗

在当今高度信息化的时代&#xff0c;数据和文件的重要性日益凸显。然而&#xff0c;由于各种原因&#xff0c;我们有时会不小心删除了一些重要的文件&#xff0c;这时候就会面临数据恢复的问题。那么&#xff0c;对于共享盘的文件&#xff0c;删除后是否还能找回呢&#xff1f;…

conda环境下version libcublasLt.so.11 not defined问题解决

1 问题描述 运行模型训练&#xff0c;错误信息如下&#xff1a; Traceback (most recent call last):File "/opt/Bert-VITS2/./text/chinese_bert.py", line 3, in <module>import torchFile "/root/anaconda3/envs/vits/lib/python3.9/site-packages/t…

如何从存档服务器上完全删除PDM用户

当创建新用户时使用“PDM 登录”类型&#xff08;如下图&#xff09;&#xff0c;PDM用户名和密码会存储于存档服务器的注册表中。 存档服务器的注册表位置如下&#xff1a; HKEY_LOCAL_MACHINE\SOFTWARE\SolidWorks\Applications\PDMWorks Enterprise\ArchiveServer\ConisioU…

【Vue】组件封装小技巧 — 利用$attrs和v-bind接收传递未定义的属性

使用介绍 在Vue.js中&#xff0c;$attrs 和v-bind可以用于组件的二次封装&#xff0c;以在封装的组件中传递父组件的属性和事件。这对于创建高度可定制的通用组件非常有用。 下面是一些示例代码&#xff1a; 假设你有一个名为MyButton的自定义按钮组件&#xff0c;它接受一些…

Apipost发起请求,能正确返回,日志却打印java.io.EOFException: null 的原因

http响应头首部Content-Length - 程序员大本营 http响应头首部Content-Length HTTP Content-Length深入实践-CSDN博客 用了这么久HTTP, 你是否了解Content-Length?-CSDN博客 具体分析可看上面参考文章。 解决办法&#xff1a;可在请求头加上Content-Length&#xff0c;准确…

linux服务器添置一块新硬盘操作

之前有一台ubuntu服务器&#xff0c;考虑未来存储容量可能不够&#xff0c;添加了一块新的硬盘&#xff0c;这是本次添置硬盘过程。 首次接上硬盘&#xff0c;提示&#xff1a; 没有找到新接入设备&#xff0c;查看接线&#xff0c;主板有个硬盘接线端子坏了&#xff0c;更换一…

机器视觉opencv答题卡识别系统 计算机竞赛

0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; 答题卡识别系统 - opencv python 图像识别 该项目较为新颖&#xff0c;适合作为竞赛课题方向&#xff0c;学长非常推荐&#xff01; &#x1f947;学长这里给一个题目综合评分(每项满分5分…

新翔绩效考核系统

介绍&#xff1a; 新翔绩效考核系统&#xff0c;是新翔软件有限公司整合众多企事业单位绩效考核需求&#xff0c;而开发的网络版绩效管理软件。软件分前台手机端评分页面和后台电脑端管理页面&#xff0c;可实现360度绩效考核、KPI考核等模式考核&#xff0c;评分方式多样、设…

计算机毕设 基于情感分析的网络舆情热点分析系统

文章目录 0 前言1 课题背景2 数据处理3 文本情感分析3.1 情感分析-词库搭建3.2 文本情感分析实现3.3 建立情感倾向性分析模型 4 数据可视化工具4.1 django框架介绍4.2 ECharts 5 Django使用echarts进行可视化展示5.1 修改setting.py连接mysql数据库5.2 导入数据5.3 使用echarts…

【网络面试必问(6)】IP协议对网络包的转发

接上一篇&#xff1a;【网络面试必问&#xff08;5&#xff09;】网络收发数据及断开服务器&#xff08;四次挥手&#xff09; 在之前的博客中&#xff0c;我们提到过&#xff0c;网络传输的报文是有真实的数据包和一些头部组成的&#xff0c;目前我们了解的头部就有TCP头、IP头…

VueUse、View Transitions API实现暗黑模式主题动画切换效果

VueUse、View Transitions API实现暗黑模式主题动画切换效果 前言View Transitions API兼容版本 VueUse 正题效果安装代码 作者GitHub&#xff1a;https://github.com/gitboyzcf 有兴趣可关注&#xff01;&#xff01; 前言 View Transitions API View Transitions API 是原生…

华东理工大学漏洞报送证书

获取来源&#xff1a;edusrc&#xff08;教育漏洞报告平台&#xff09; url&#xff1a;主页 | 教育漏洞报告平台 兑换价格&#xff1a;20金币 获取条件&#xff1a;提交华东理工大学任意中危或以上级别漏洞 证书规格&#xff1a;附送图二实物及封皮

[ Linux Busybox ] nandwrite 命令解析

文章目录 相关结构体nandwrite 函数实现nandwrite 实现流程图 文件路径&#xff1a;busybox-1.20.2/miscutils/nandwrite.c 相关结构体 MTD 相关信息结构体 struct mtd_info_user {__u8 type; // MTD 设备类型__u32 flags; // MTD设备属性标志__u32…

【Proteus仿真】【STM32单片机】水质监测报警系统设计

文章目录 一、功能简介二、软件设计三、实验现象联系作者 一、功能简介 本项目使用Proteus8仿真STM32单片机控制器&#xff0c;使用按键、LED、蜂鸣器、LCD1602、PCF8591 ADC、PH传感器、浑浊度传感器、DS18B20温度传感器、继电器模块等。 主要功能&#xff1a; 系统运行后&a…

汽车标定技术(七)--基于模型开发如何生成完整的A2L文件(2)

目录 1. 自定义ASAP2文件 2. asap2userlib.tlc需要修改的部分 3. 标定量观测量地址替换 3.1 由elf文件替换 3.2 由map文件替换 3.3 正则表达式&#xff08;含asap2post.m修改方法&#xff09; 4.小结 书接上文汽车标定技术(五)--基于模型开发如何生成完整的A2L文件(1)-C…