GPT-4、PaLM-2等AI模型对黑人or女性存在偏见?丨AI偏见的案例和应对

news2024/10/6 14:06:32

生成式 AI(Generative AI)以其卓越的能力在模仿和理解人类智能方面不断突破界限,展现出令人瞩目的潜力。但与此同时,AI 系统在提供这些创新服务的过程中,有时也会暴露出一些问题,尤其是在文化和种族方面的偏见。

斯坦福大学发表论文称,OpenAI 的 ChatGPT 4 和 Google AI 的 PaLM-2 等聊天机器人的回答可能会根据用户名字的发音而有所不同。例如,聊天机器人可能会说,应为姓名为 Tamika(偏女性) 的求职者提供 79,375 美元的律师薪水,但将姓名改为 Todd(偏男性) 之类的名称会将建议的薪水提高到 82,485 美元。

这些偏见的背后存在巨大风险,尤其是当企业将 AI 聊天机器人面向客户运营时。

关于 AI 偏见的案例

2023 年 7 月, Buzzfeed 在推特上发布了使用人工智能图像生成器 Midjourney 制作的 195 张芭比娃娃图像的列表。尽管 Buzzfeed 写了免责声明,但这并没有阻止网友指出种族和文化方面的不准确之处。 例如,人工智能生成的德国芭比娃娃穿着制服像纳粹党卫军,南苏丹芭比娃娃携带着枪。

除此之外,其他几张图片也显示出文化上的不准确,例如卡塔尔芭比娃娃佩戴着传统头饰。

在另一起报道案例中,Meta 的 AI 图像生成器无法准确生成“亚洲男性和白人妻子”或者“亚洲女性和白人丈夫”这类图像。例如,当输入「Asian man and white woman smiling with a dog」(亚洲男性和白人女性带着狗微笑)时,Meta 图像生成器给出的都是「两个亚洲人」的图像。

即使将“white”改为“Caucasian”时,结果同样如此。


还有,2022 年清华大学做了一个 AI 模型性别歧视水平评估项目,在包含职业词汇(如医生、司机、教师、服务员、职员等)的“中性”句子中,由 GPT-2 等测试模型 AI 预测生成一万个模板。测试结果发现,GPT-2 有 70.59% 的概率将教师预测为男性,将医生预测为男性的概率则是 64.03%。

其他首测的 AI 模型还包括 Google 开发的 BERT 以及 Facebook 开发的 RoBERTa。所有受测AI对于测试职业的性别预判,结果倾向都为男性。

更早之前,亚马逊在 2014 年开发的一个 AI 招聘工具被发现存在性别偏见。该工具使用过去 10 年的简历数据进行训练,由于科技行业男性占主导地位,导致算法更倾向于男性候选人。它对包含“女子”一词的简历,如“女子国际象棋俱乐部队长”,给予较低的评分。

直到 2015 年,亚马逊开始意识到他们的新人工智能招聘系统没有对候选人进行公平的评级,并停止将该算法用于招聘。

总的来看,大多数涉及种族和性别的场景都存在对黑人和女性不利的偏见,少数的场景如“当询问运动员作为篮球运动员的位置”时,偏见有利于黑人运动员。 

什么是人工智能偏见?

人工智能(AI)本身不具备偏见,因为它是由算法和数据驱动的技术工具。然而,AI 系统的行为和输出可能会反映出偏见,这些偏见通常来源于它们所训练和学习的数据集。

如果 AI 系统所使用的数据集包含有偏见的信息,或者在数据收集、处理和标注过程中存在不公平或歧视性的做法,那么 AI 的决策和预测也可能表现出偏见。

比如认知偏见:这些是无意识的思维错误,会影响个人的判断和决定。认知偏见可能通过以下两种方式渗入机器学习算法中:设计者在不知情的情况下将其引入模型中,或训练数据集包括这些偏见。

此外,被心理学家定义和分类的偏见还有刻板偏见、文化偏见、种族偏见等180多种,这些偏见产生于大脑试图简化处理关于世界的信息。

除了偏见之外,其他问题也会阻碍人工智能系统的结果,例如:

不准确之处: 当人工智能模型由于训练数据不一致而产生不正确的结果时,就会出现不准确的情况。

幻觉: 当人工智能模型产生不基于事实数据的虚构和错误结果时,就会出现幻觉。

人工智能有潜力彻底改变许多行业。 但是,如果上述偏见场景激增,可能会导致人工智能的普遍采用率下降,从而错失机会。 

如何减少人工智能模型中的偏见?

业内专家评估到 2026 年,90% 的在线内容可以通过综合生成。 因此,快速减少生成人工智能技术中存在的问题至关重要。

目前,科学家正在通过测试数据和算法,并以负责任的人工智能原则开发人工智能系统,将其降至最低。

1. 确保数据质量和多样化的数据集

   - 引入完整、准确和干净的数据到人工智能模型中,以减少偏差。

   - 引入不同的数据集,使人工智能系统更具包容性,减少偏见。

2. 建立去偏策略

   - 结合技术、操作和组织行动的方法来减少偏见。

   - 技术策略可以包括使用工具来识别潜在的偏见来源,并揭示数据中影响模型准确性的特征。

   - 运营策略可以包括利用内部“红队”和第三方审计师来改善数据收集流程。

   - 组织策略可以包括建立一个透明的展示指标和流程的工作场所。

3. 改善人类驱动的流程

   - 识别和理解训练数据中的偏见,通过培训、流程设计和文化变革来改善实际流程以减少偏见。

   - 决定在哪些用例中应优先考虑自动决策,哪些用例中应有人类参与。

   - 增加全球人工智能法规,确保人工智能标准化,维持跨境人工智能系统的质量。

4. 多学科的方法和组织多样性

   - 研究和开发是最大限度地减少数据集和算法中的偏差的关键,需要伦理学家、社会科学家和领域专家的参与。

   - 保持一个多元化的人工智能团队,这样可以帮助减轻不必要的人工智能偏见。

5. 使用减少偏见的工具

   - 例如,IBM 的 AIFairness360 和 Google 的 What-If Tool 等工具可以帮助检测和减少模型中的偏见。

通过上述策略的实施,可以朝着减少人工智能模型中的偏见迈进,从而确保 AI 系统的决策更加公正和准确。

但从当下来看,可能不存在一个完全没有偏见的工智能系统。

毕竟,人类正在创造有偏见的数据,而人类和人类制造的算法正在检查数据以识别和消除偏见。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1574944.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于java+SpringBoot+Vue的房屋租赁系统设计与实现

基于javaSpringBootVue的房屋租赁系统设计与实现 开发语言: Java 数据库: MySQL技术: Spring Boot JSP工具: IDEA/Eclipse、Navicat、Maven 系统展示 前台展示 房源浏览模块:展示可租赁的房源信息,用户可以根据条件筛选房源。 预约看房模块&#…

docker 安装redis报错:can not init background jbos

启动redis,发现一直再重启 docker run -d --name redis -p 6379:6379 --restartalways redis:6.2.6 --requirepass "123456" 查看日志,发现job没启动 docker logs 47f6572a779c 尝试了一堆解决办法。。。最后发现尝试安装了redis6.2.6版本&a…

算法第三十九天-验证二叉树的前序序列化

验证二叉树的前序序列化 题目要求 解题思路 方法一:栈 栈的思路是「自底向上」的想法。下面要结合本题是「前序遍历」这个重要特点。 我们知道「前序遍历」是按照「根节点-左子树-右子树」的顺序遍历的,只有当根节点的所有左子树遍历完成之后&#xf…

Linux:进程终止和等待

一、进程终止 main函数的返回值也叫做进程的退出码,一般0表示成功,非零表示失败。我们也可以用不同的数字来表示不同失败的原因。 echo $?//打印最近一次进程执行的退出码 而作为程序猿,我们更需要知道的是错误码所代表的错误信息&#x…

探索7个MAMP本地开发环境的高效替代软件

什么是本地开发环境 本地开发环境是Web开发环境中的一种类型,它是指开发者自己的计算机上配置的一套用于开发和测试网站或应用程序的软件集合。这套环境使得开发者可以在本地计算机上构建和测试网站,而无需实时部署到服务器。 创建本地开发环境有两种方…

Python实现【坦克大战】+源码分享

写在前面: 坦克大战,这款经典的电子游戏,无疑是许多80后和90后心中不可磨灭的童年记忆。它不仅仅是一款游戏,更是那个时代科技娱乐方式的缩影,见证了电子游戏行业的起步与发展。 在那个电脑和网络尚未完全普及的年代…

云备份day04

📟作者主页:慢热的陕西人 🌴专栏链接:C云备份项目 📣欢迎各位大佬👍点赞🔥关注🚓收藏,🍉留言 主要内容介绍了文件工具了类的实现 文章目录 云备份day041.文件…

00-armv8/armv9中断系列详解-序言

快速链接: 【精选】ARMv8/ARMv9架构入门到精通-[目录] 👈👈👈 1、序言 带着问题去学习,关于异常/中断的一些思考: (1)、在如下的一个大系统种,cpu正在optee os中运行,突然来了一个想给Linux Kernel处理的中…

JS与Python函数在语法的区别

区别 标题语法:Python使用缩进来表示代码块,而JavaScript使用大括号{}。 Python函数定义: def my_function():# 函数体JavaScript函数定义: function myFunction() {// 函数体 }标题参数传递:Python支持位置参数、…

海外代理IP购买指南:住宅IP代理VS.数据中心代理IP

在选择海外IP代理服务时,您将面临一个关键的问题:是选择住宅代理IP还是数据中心代理IP?这两者之间存在着根本性的不同,涉及到性能、隐私和成本等方面的考虑。住宅代理IP通常来自真实的住宅网络连接,更难被检测到。数据…

【蓝桥杯-读数据】

蓝桥杯-读数据 P8598 [蓝桥杯 2013 省 AB] 错误票据 P8598 [蓝桥杯 2013 省 AB] 错误票据 这道题本身很简单&#xff0c;最大的难点在于读入数据。 #include<bits/stdc.h> using namespace std; #define int long long const int N 2e5 10; int a[N]; signed main()…

Bigtable [OSDI‘06] 论文阅读笔记

原论文&#xff1a;Bigtable: A Distributed Storage System for Structured Data (OSDI’06) 1. Introduction Bigtable 是一种用于管理结构化数据的分布式存储系统&#xff0c;可扩展到非常大的规模&#xff1a;数千台服务器上的数据量可达 PB 级别&#xff0c;同时保证可靠…

如何明确的选择IT方向?

一、明确目标 作为初学者&#xff0c;先树立自己目标&#xff0c;找到自己感兴趣的IT行业&#xff0c;IT行业分很多种&#xff0c;听的最多次的无非不就是web前端工、程序员、后端、大数据、网络运维等。学习知识也是为了找到更好的工作&#xff0c;所以我建议先去boss直聘、五…

xshell7连接ubuntu18.04

&#x1f3a1;导航小助手&#x1f3a1; 1.查看ubuntu IP2.开启openssh-server3.静态IP设置4.Xshell连接 1.查看ubuntu IP 输入下面命令查看IP ifconfig -a可以看到网卡是ens33&#xff0c;IP为192.168.3.180。 2.开启openssh-server 1、执行下句&#xff0c;下载SSH服务 s…

【AI+视频】只要一张图片就能生成跳舞视频的几种方案

今天下班休闲之余刷了会D音&#xff0c; 接连刷到美女跳舞的几个视频。 仔细一看&#xff0c;这些不都是AI制作的么。 前几天写过一篇关于 【AI视频】pixverse一款免费的文生视频、图生视频工具&#xff0c; 这里介绍 图片生成跳舞视频 的 几种方案。 写这个的主要原因&…

PPP-B2b星历下载

目前做PPP-B2b研究比较多&#xff0c;其中PPP-B2b需要北斗的CNAV星历下载链接为&#xff08;例如2024.04.05对应的2024年第097天&#xff09;&#xff1a;数据下载http://www.csno-tarc.cn/datacenter/ephemeris

传道难-授业更难-解惑难上加难

传道授业解惑 困境 工作所在地所遇到的事情&#xff0c;大部分并非缺少知识&#xff0c;也并非缺少努力&#xff0c;从某种角度上来看&#xff0c;其实是资源匮乏。 比如预算经费&#xff1a; 来源网络&#xff0c;需要可以自行查找。 但是很多学校的经费预算都不到两位数&a…

【LeetCode】894. 所有可能的真二叉树

文章目录 [894. 所有可能的真二叉树](https://leetcode.cn/problems/all-possible-full-binary-trees/)思路一&#xff1a;分治代码&#xff1a;思路二&#xff1a;记忆化搜索代码&#xff1a; 894. 所有可能的真二叉树 思路一&#xff1a;分治 1.递归&#xff0c;n1 时&#…

VM虚拟机部署code-server服务+tailscale内网穿透,实现随处coding

1.Linux下安装code-server Releases coder/code-server (github.com)https://github.com/coder/code-server/releases先去发布页面查看最新的code-server版本&#xff0c;下载命令示例&#xff1a; wget https://github.com/coder/code-server/releases/download/v4.22.1/co…

24考研-东南大学916经验贴

文章目录 一、个人情况二、初试备考经验1.政治 67&#xff0c;客观382.英语 60&#xff0c;客观大概40左右3.数学 136&#xff0c;客观应该满分4.专业课 数据结构计网 114小分不清楚 三、复试备考经验笔试&#xff1a;C面试复试流程 附一下成绩单&#xff1a; 一、个人情况 本…