道德与社会问题简报 #4: 文生图模型中的偏见

news2024/11/18 4:36:38

简而言之: 我们需要更好的方法来评估文生图模型中的偏见

介绍

文本到图像 (TTI) 生成 现在非常流行,成千上万的 TTI 模型被上传到 Hugging Face Hub。每种模态都可能受到不同来源的偏见影响,这就引出了一个问题: 我们如何发现这些模型中的偏见?在当前的博客文章中,我们分享了我们对 TTI 系统中偏见来源的看法以及解决它们的工具和潜在解决方案,展示了我们自己的项目和来自更广泛社区的项目。

图像生成中编码的价值观和偏见

偏见和价值 之间有着非常密切的关系,特别是当这些偏见和价值嵌入到用于训练和查询给定 文本到图像模型 的语言或图像中时; 这种现象严重影响了我们在生成图像中看到的输出。尽管这种关系在更广泛的人工智能研究领域中是众所周知的,并且科学家们正在进行大量努力来解决它,但试图在一个模型中表示一个给定人群价值观的演变性质的复杂性仍然存在。这给揭示和充分解决这一问题带来了持久的道德挑战。

例如,如果训练数据主要是英文,它们可能传达相当西方化的价值观。结果我们得到了对不同或遥远文化的刻板印象。当我们比较 ERNIE ViLG (左) 和 Stable Diffusion v 2.1 (右) 对同一提示“北京的房子”的结果时,这种现象显得非常明显:

09e085e57d780f4616acab623b5ecfb4.png
results of ERNIE ViLG (left) and Stable Diffusion v 2.1 (right) for the same prompt, a house in Beijing

偏见的来源

近年来,人们在单一模态的 AI 系统中进行了大量关于偏见检测的重要研究,包括自然语言处理 (Abid et al., 2021) 和计算机视觉 (Buolamwini and Gebru, 2018)。由于机器学习模型是由人类构建的,因此所有机器学习模型 (实际上,所有技术) 都存在偏见。这可能表现为图像中某些视觉特征的过度和不足 (例如,所有办公室工作人员都系着领带),或者文化和地理刻板印象的存在 (例如,所有新娘都穿着白色礼服和面纱,而不是更具代表性的世界各地的新娘,如穿红色纱丽的新娘)。鉴于 AI 系统被部署在社会技术背景下,并且在不同行业和工具中广泛部署 (例如 Firefly,Shutterstock),它们特别容易放大现有的社会偏见和不平等。我们旨在提供一个非详尽的偏见来源列表:

训练数据中的偏见: 一些流行的多模态数据集,如文本到图像的 LAION-5B,图像字幕的 MS-COCO 和视觉问答的 VQA v2.0,已经被发现包含大量的偏见和有害关联 (Zhao et al 2017,Prabhu and Birhane, 2021,Hirota et al, 2022),这些偏见可能会渗透到在这些数据集上训练的模型中。例如,来自 Hugging Face Stable Bias project 的初步结果显示,图像生成缺乏多样性,并且延续了文化和身份群体的常见刻板印象。比较 Dall-E 2 生成的 CEO (右) 和经理 (左),我们可以看到两者都缺乏多样性:

9992e44631c74ef0148f4e098023be70.png
Dall-E 2 generations of CEOs (right) and managers (left)

预训练数据过滤中的偏见: 在将数据集用于训练模型之前,通常会对其进行某种形式的过滤; 这会引入不同的偏见。例如,在他们的 博客文章 中,Dall-E 2 的创建者发现过滤训练数据实际上会放大偏见 - 他们假设这可能是由于现有数据集偏向于在更性感化的背景下呈现女性,或者由于他们使用的过滤方法本身具有偏见。

推理中的偏见: 用于指导 Stable Diffusion 和 Dall-E 2 等文本到图像模型的训练和推理的 CLIP 模型 有许多 记录详细的偏见,涉及年龄、性别和种族或族裔,例如将被标记为 白人中年男性 的图像视为默认。这可能会影响使用它进行提示编码的模型的生成,例如通过解释未指定或未明确指定的性别和身份群体来表示白人和男性。

模型潜在空间中的偏见: 已经进行了一些 初步工作,探索模型的潜在空间并沿着不同轴 (如性别) 引导图像生成,使生成更具代表性 (参见下面的图像)。然而,还需要更多工作来更好地理解不同类型扩散模型的潜在空间结构以及影响生成图像中反映偏见的因素。

f8566c433510ef4cc9ec61ef54bd0f27.png
Fair Diffusion generations of firefighters.

后期过滤中的偏见: 许多图像生成模型都内置了旨在标记问题内容的安全过滤器。然而,这些过滤器的工作程度以及它们对不同类型内容的鲁棒性有待确定 - 例如,对 Stable Diffusion 安全过滤器进行红队对抗测试 表明,它主要识别性内容,并未能标记其他类型的暴力、血腥或令人不安的内容。

检测偏见

我们上面描述的大多数问题都不能用单一的解决方案解决 - 实际上,偏见是一个复杂的话题,不能仅靠技术来有意义地解决。偏见与它所存在的更广泛的社会、文化和历史背景紧密相连。因此,解决 AI 系统中的偏见不仅是一个技术挑战,而且是一个需要多学科关注的社会技术挑战。其中包括工具、红队对抗测试和评估在内的一系列方法可以帮助我们获得重要的见解,这些见解可以为模型创建者和下游用户提供有关 TTI 和其他多模态模型中包含的偏见的信息。

我们在下面介绍一些这些方法:

探索偏见的工具: 作为 Stable Bias 项目 的一部分,我们创建了一系列工具来探索和比较不同文本到图像模型中偏见的视觉表现。例如,Average Diffusion Faces 工具让你可以比较不同职业和不同模型的平均表示 - 如下面所示,对于 ‘janitor’,分别为 Stable Diffusion v1.4、v2 和 Dall-E 2:

25c53c6a266159222b9d74b76c081572.png
Average faces for the 'janitor' profession, computed based on the outputs of different text to image models.

其他工具,如 Face Clustering tool 和 Colorfulness Profession Explorer 工具,允许用户探索数据中的模式并识别相似性和刻板印象,而无需指定标签或身份特征。事实上,重要的是要记住,生成的个人图像并不是真实的人,而是人工创造的,所以不要把它们当作真实的人来对待。根据上下文和用例,这些工具可以用于讲故事和审计。

红队对抗测试: “红队对抗测试” 包括通过提示和分析结果来对 AI 模型进行潜在漏洞、偏见和弱点的压力测试。虽然它已经在实践中用于评估语言模型 (包括即将到来的 DEFCON 上的 Generative AI Red Teaming 活动,我们也参加了),但目前还没有建立起系统化的红队对抗测试 AI 模型的方法,它仍然相对临时性。事实上,AI 模型中有这么多潜在的故障模式和偏见,很难预见它们全部,而生成模型的 随机性质 使得难以复现故障案例。红队对抗测试提供了关于模型局限性的可行性见解,并可用于添加防护栏和记录模型局限性。目前没有红队对抗测试基准或排行榜,突显了需要更多开源红队对抗测试资源的工作。Anthropic 的红队对抗测试数据集 是唯一一个开源的红队对抗测试 prompts,但仅限于英语自然语言文本。

评估和记录偏见: 在 Hugging Face,我们是 模型卡片 和其他形式的文档 (如 数据表、README 等) 的大力支持者。在文本到图像 (和其他多模态) 模型的情况下,使用探索工具和红队对抗测试等上述方法进行的探索结果可以与模型检查点和权重一起共享。其中一个问题是,我们目前没有用于测量多模态模型 (特别是文本到图像生成系统) 中偏见的标准基准或数据集,但随着社区在这个方向上进行更多 工作,不同的偏见指标可以在模型文档中并行报告。

价值观和偏见

上面列出的所有方法都是检测和理解图像生成模型中嵌入的偏见的一部分。但我们如何积极应对它们呢?

一种方法是开发新的模型,代表我们希望它成为社会性模型。这意味着创建不仅模仿我们数据中的模式,而且积极促进更公平、更公正观点的 AI 系统。然而,这种方法提出了一个关键问题: 我们将谁的价值观编程到这些模型中?价值观在不同文化、社会和个人之间有所不同,使得在 AI 模型中定义一个“理想”的社会应该是什么样子成为一项复杂的任务。这个问题确实复杂且多面。如果我们避免在我们的 AI 模型中再现现有的社会偏见,我们就面临着定义一个“理想”的社会表现的挑战。社会并不是一个静态的实体,而是一个动态且不断变化的构造。那么,AI 模型是否应该随着时间的推移适应社会规范和价值观的变化呢?如果是这样,我们如何确保这些转变真正代表了社会中所有群体,特别是那些经常被忽视的群体呢?

此外,正如我们在 上一期简报 中提到的,开发机器学习系统并没有一种单一的方法,开发和部署过程中的任何步骤都可能提供解决偏见的机会,从一开始谁被包括在内,到定义任务,到策划数据集,训练模型等。这也适用于多模态模型以及它们最终在社会中部署或生产化的方式,因为多模态模型中偏见的后果将取决于它们的下游使用。例如,如果一个模型被用于人机交互环境中的图形设计 (如 RunwayML 创建的那些),用户有多次机会检测和纠正偏见,例如通过更改提示或生成选项。然而,如果一个模型被用作帮助法医艺术家创建潜在嫌疑人警察素描的 工具 (见下图),那么风险就更高了,因为这可能在高风险环境中加强刻板印象和种族偏见。

6b473520ae4319d6de458f4f1fdedde6.png
Forensic AI Sketch artist tool developed using Dall-E 2.

其他更新

我们也在继续在道德和社会的其他方面进行工作,包括:

  • 内容审核:

    • 我们对我们的 内容政策 进行了重大更新。距离我们上次更新已经快一年了,自那时起 Hugging Face 社区增长迅速,所以我们觉得是时候了。在这次更新中,我们强调 同意 是 Hugging Face 的核心价值之一。要了解更多关于我们的思考过程,请查看 公告博客

  • AI 问责政策:

    • 我们提交了对 NTIA 关于 AI 问责政策 的评论请求的回应,在其中我们强调了文档和透明度机制的重要性,以及利用开放协作和促进外部利益相关者获取的必要性。你可以在我们的 博客文章 中找到我们回应的摘要和完整文档的链接!

结语

从上面的讨论中你可以看出,检测和应对多模态模型 (如文本到图像模型) 中的偏见和价值观仍然是一个悬而未决的问题。除了上面提到的工作,我们还在与社区广泛接触这些问题 - 我们最近在 FAccT 会议上共同主持了一个关于这个主题的 CRAFT 会议,并继续在这个主题上进行数据和模型为中心的研究。我们特别兴奋地探索一个更深入地探究文本到图像模型中所蕴含的 价值 及其所代表的方向 (敬请期待!)。


英文原文: https://hf.co/blog/ethics-soc-4

作者: Sasha Luccioni, Giada Pistilli, Nazneen Rajani, Elizabeth Allendorf, Irene Solaiman, Nathan Lambert, Margaret Mitchell

译者: innovation64

排版/审校: zhongdongy (阿东)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/734139.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android启动流程优化 上篇

Android启动流程优化 上篇 本文链接:Android启动流程优化 上篇_猎羽的博客-CSDN博客 启动流程 各个阶段图 1、各个阶段的概括总结 分为5个大阶段或者10个小阶段 【字节跳动团队】内部论坛分享也是这么处理的 补充一些只是细节点: application#onCreate()运行…

基于多案例系统学习防洪评价报告编制方法与水流数学模型建模(HECRAS、MIKE、EFDC、Delft3D、FVCOM、SWAT、SWMM等模型应用)

目录 ​专题一 《防洪评价报告编制导则解读河道管理范围内建设项目编制导则》(SL/T808- 2021)解读编制导则解读 专题二 防洪评价相关制度与解析 ★专题三 案例演练解析 专题四 防洪评价地形获取及常用计算实践 专题五 HEC-RAS软件原理及应用案例解析…

leetcode160.相交链表

https://leetcode.cn/problems/intersection-of-two-linked-lists/solution/ 相交链表是指两个单向链表在某个节点处相交,之后形成了共同的后续部分。通常,两个链表的长度不相等。在相交节点之前,两个链表的节点数可能不同,但在相…

Java后端编译与优化

如果我们将字节码看作是程序语言的一种中间表示形式,那编译器无论在何时、在何种状态下把Class文件转换成与本地基础设施相关的二进制机器码,它都可以视为整个编译过程的后端。 1 即时编译器 即时编译器是指运行时将热点代码编译成本地机器码&#xff…

程序员必须掌握哪些算法?——前端开发工程师需要掌握的算法

文章目录 📋前言🎯什么是算法?🎯前端开发工程师需要掌握的算法🧩排序算法(如快速排序、归并排序)🧩搜索算法(如二分搜索)🧩图算法(如广…

【Unity造轮子】2D横版平台跳跃游戏实现多段跳完美手感(含源码)

文章目录 前言先看效果,手感很丝滑原理开始1. 看到检测点的检测范围2. 二段跳实现3. 动画控制器配置 源码扩展完结 前言 随着游戏技术的不断发展,2D横版平台跳跃游戏成为许多玩家的最爱。这类游戏以其简单而有趣的玩法和精致的视觉效果吸引着无数游戏爱…

Kotlin~Decorator装饰器模式

概念 装饰模式指的是在不必改变原类文件和使用继承的情况下,动态地扩展一个对象的功能。它是通过创建一个包装对象,也就是装饰来包裹真实的对象。可以运行时动态添加新的功能,而无需改变原来的代码。 特点: 灵活扩展新的功能动态…

接口设计的总结

目录 前言 设计好接口的 36 个锦囊 总结 前言 作为后端开发,不管是什么语言,Java、Go 还是 C,其背后的后端思想都是类似的。我们做后端开发工程师,主要工作就是:如何把一个接口设计好。所以,今天就给大家…

北京大学考研机试题:二叉树

【题目来源】https://www.acwing.com/problem/content/description/3474/【题目描述】 如上图所示,由正整数 1,2,3…… 组成了一颗特殊二叉树。 我们已知这个二叉树的最后一个结点是 n。 现在的问题是,结点 m 所在的子树中一共包括…

MobileNeRF在Windows上的配置

MobileNeRF于2023年提出,源码地址:https://github.com/google-research/jax3d/tree/main/jax3d/projects/mobilenerf ,论文为:《MobileNeRF: Exploiting the Polygon Rasterization Pipeline for Efficient Neural Field Renderin…

QT自定义工具条渐变背景颜色一例

使用样式定义: QWidget* toolbar new QWidget(this);toolbar->setObjectName("main_tool");toolbar->setStyleSheet("#main_tool{background: qlineargradient(x1:0 , y1:0 , x2:1 , y2:0,""stop:0 rgba(0,255,0, 0.2),"&q…

Nuxt3 components公共组件

1.目录结构 效果实现:写一个公共的right组件,在index和about页面同时引用它 2.index页面引入 index页面显示效果 about页面引用及效果

组件的自定义事件

src/components/School.vue <template><div class"school"><h2>学校名称&#xff1a;{{ name}}</h2><h2>学校地址&#xff1a;{{ address }}</h2><button click"sendSchoolName">把学校名给App</button>…

数据集成的强大联盟:Elasticsearch、Kibana、Logstash、MySQL

通常&#xff0c;很多关系数据项目都使用 MySQL。 它对于标准的 CRUD 操作是有益的&#xff0c;但有时我们需要做额外的过程。 当我们搜索某些内容时&#xff0c;我们会消耗资源或合并多个表。 有时&#xff0c;即使不是&#xff0c;可能仍然需要复杂的 SQL 查询。 也许这不是正…

如何查看OpenAI的AccessToken?

如何查看OpenAI的AccessToken&#xff1f; 记录一下如何查看 OpenAI的 AccessToken 文章目录 如何查看OpenAI的AccessToken&#xff1f;前提具体操作总结 前提 &#x1f4a7;首先&#xff0c;在获取AccessToken前&#xff0c;你需要达成 以下两个条件: 拥有一个可用的OpenA…

ARM CORETEX M0简介

ARM CORETEX M0简介 1. M0处理器简单框图 处理器内核&#xff1a;逻辑控制与运算 内部总线系统&#xff1a;单总线将处理器与外部的存储器和外部连接&#xff0c;进行数据交互&#xff08;冯诺依曼架构&#xff0c;数据与指令一起&#xff09; NVIC&#xff1a;嵌套向量中断控…

【Matlab】智能优化算法_亨利气体溶解度优化算法HGSO

【Matlab】智能优化算法_亨利气体溶解度优化算法HGSO 1.背景介绍2.数学模型2.1 亨利定律2.2 HGSO 3.文件结构4.伪代码5.详细代码及注释5.1 Create_Groups.m5.2 Evaluate.m5.3 fun_checkpoisions.m5.4 fun_getDefaultOptions.m5.5 HGSO.m5.6 main.m5.7 sumsqu.m5.8 update_posit…

机器学习总览

机器学习 1.什么是机器学习&#xff1f; 机器学习是使计算机像人类一样学习与行动的科学&#xff0c;并通过观察与现实世界交互的形式向计算机提供数据和信息&#xff0c;从而随着时间的推移以自主的方式改善其学习。 通过经验提高某些任务性能的计算机程序。 人工智能>机器…

FreeRTOS ~(六)信号量 ~ (1/3)信号量解决同步缺陷

前情提要 FreeRTOS ~&#xff08;四&#xff09;同步互斥与通信 ~ &#xff08;1/3&#xff09;同步的缺陷 FreeRTOS ~&#xff08;五&#xff09;队列的常规使用 ~ &#xff08;1/5&#xff09;队列解决同步缺陷 举例子说明&#xff1a;利用信号量解决前述的"同步的缺陷&…

最具价值开源项目收藏--持续更新

轻量级开源笔记应用&#xff08;memos&#xff09; 该项目基于 Go React.js SQLite 技术栈开发&#xff0c;兼具高性能与可定制性&#xff0c;适用于日常生活办公中的各类笔记管理场景。 开源地址&#xff1a;https://github.com/usememos/memos 跨平台无缝传输文件&#…