FairJob:促进在线广告系统公平性研究

news2025/1/9 19:55:27

       在人工智能(AI)与人类动态的交汇处,既存在机遇也存在挑战,特别是在人工智能领域。尽管取得了进步,但根植于历史不平等中的持续偏见仍然渗透在我们的数据驱动系统中,这些偏见不仅延续了不公平现象,还加剧了社会的分歧。历史上的偏见影响了数据收集,对AI模型的结果产生了影响,经常放大了现有的不平等状况。尽管存在关于隐私、责任和公共关系的担忧,但收集特殊和敏感类别数据对于偏见评估至关重要。此外,不断演变的法律框架,例如最近的AI法案和通用数据保护条例[英国信息专员办公室,2022年],要求检测、预防和减轻偏见,同时对敏感数据的使用施加了一些限制。

      在广告中的算法歧视可能与敏感垂直领域有关,这些领域突出了有益的就业、金融和住房机会,或者关于谁看到了可能不太受欢迎的广告,例如掠夺性贷款服务的广告。虽然广告中的不公平行为不是惩罚性的,而是辅助性的,即公平性在于提供平等获取宝贵机会的机会,但确保广告实践的公平性至关重要。

      大多数关于广告中歧视行为的研究都是通过创建广告活动、选择目标受众,并从用户的角度分析数据进行的,而没有访问算法特征。缺乏公开可用的、现实的数据集导致研究人员基于私有数据发布结果,导致科学界的主张无法复现。这为关键评估和在科学界建立在先前工作之上带来了挑战。

在线广告筛选简化流程

为了促进现实场景中的公平性研究,本文发布了一个大规模的公平意识广告FairJob数据集

链接:https://huggingface.co/datasets/criteo/FairJob。

1 广告中的公平性问题

1.1 招聘广告中的性别歧视

     研究表明,招聘广告的投放过程中存在性别歧视现象。例如,管理职位的招聘广告更倾向于展示给男性用户,这可能导致女性用户获得的机会更少,加剧性别差距。

      这种歧视可能并非广告服务平台的本意,而是由于数据偏差或算法设计不当导致的。

1.2 市场偏差

       广告投放平台通常采用实时竞价 (RTB) 机制进行广告投放。在这个过程中,平台会根据用户和广告主的特征进行竞价,并选择最优的广告进行展示。

      由于市场竞争和成本效益的考虑,一些广告主可能会针对特定群体投放广告。例如女性用户可能更贵,因此平台可能会减少对女性用户的广告投放。这种市场偏差可能会导致广告投放结果出现不公平现象。

1.3 算法偏差

广告推荐算法可能会根据用户的历史行为和特征进行推荐,如果这些数据和算法存在偏差,那么推荐结果也可能存在偏差。

例如,如果算法认为男性用户更倾向于点击某些类型的广告,那么这些广告就会更频繁地展示给男性用户,从而导致女性用户获得的机会更少。

1.4 评估指标

       广告推荐系统的评估指标通常包括点击率、转化率等,但这些指标可能无法完全反映广告的公平性。

     例如,即使广告投放结果在不同群体之间没有显著差异,但如果某些群体对广告的响应率本身就较低,那么这种结果仍然是不公平的。

1.5 数据隐私

为了评估和解决广告中的公平性问题,需要收集和分析用户的数据,包括敏感数据(例如性别、种族等)。

然而,收集敏感数据可能涉及到数据隐私和安全问题,需要进行严格的保护和管理。

2 FairJob数据集

       FairJobs 数据集是一个用于研究广告推荐系统公平性的大型数据集。它包含匿名化的用户和广告主特征,以及广告投放结果,旨在帮助研究人员评估和解决广告中的公平性问题。

2.1 数据来源

     FairJobs 数据集来自 Criteo AdTech 公司在 2024 年进行的一项为期 5 个月的招聘广告投放活动。数据包含以下信息:

  • 用户特征: 包括 20 个匿名化的类别特征和 39 个匿名化的数值特征。
  • 广告主特征: 包括 7 个匿名化的类别特征。
  • 广告投放结果: 包括点击情况(是否点击广告)、广告是否为高级职位、以及用户、广告和广告投放的唯一标识符。
  • 敏感属性代理: 由于数据集不包含性别等敏感信息,因此使用用户与男性或女性产品互动的倾向作为性别代理。

2.2 数据特点

  • 大规模: 数据集包含 107 万多条记录,可以用于训练和评估大规模的机器学习模型。
  • 多样性: 数据集包含多种类型的特征,包括类别特征和数值特征,可以用于研究不同类型特征的公平性问题。
  • 不平衡性: 数据集的正负样本比例严重不平衡,可以用于研究不平衡数据下的公平性问题。
  • 匿名化: 数据集经过匿名化处理,保护用户隐私。

2.3 数据应用

     FairJobs 数据集可以用于以下研究:

  • 公平性评估: 评估广告推荐系统的公平性,例如不同性别群体获得广告的机会是否平等。
  • 公平性算法设计: 开发新的公平性算法,例如“公平性惩罚”和“对抗训练”,以减少算法偏差。
  • 评估指标改进: 开发新的评估指标,例如“群体公平性”和“机会公平性”,以更全面地评估广告推荐系统的公平性。
  • 数据隐私保护: 研究数据匿名化、差分隐私等技术,保护用户数据隐私。

2.4 FairJobs 数据集的优势

  • 真实场景: 数据集来自真实的广告投放活动,可以更好地反映现实世界中的公平性问题。
  • 匿名化: 数据集经过匿名化处理,可以保护用户隐私。
  • 开放获取: 数据集开放获取,方便研究人员进行研究和实验。

2.5 FairJobs 数据集的局限性

  • 敏感属性代理: 由于数据集不包含性别等敏感信息,因此使用用户与男性或女性产品互动的倾向作为性别代理,可能存在一定的误差。
  • 数据不平衡性: 数据集的正负样本比例严重不平衡,可能会影响模型的训练和评估。
  • 市场偏差: 数据集可能存在市场偏差,例如某些广告主可能更倾向于投放给特定群体。

3 实验

3.1 实验设置

实验源代码:https://github.com/criteo-research/FairJob-dataset

3.1.1 数据集

FairJob 数据集,包含 1,072,226 条记录,每条记录包含用户特征、产品特征、点击标签、性别代理、职位等级等信息。

3.1.2 模型

3.1.2.1 基线模型

  • Dummy: 基于单一阈值对正类概率进行分类。在无感知设置中使用,即不考虑受保护属性。Dummy分类器的性能虽然有限,但它提供了一个基准,帮助我们理解在没有任何模型学习的情况下的公平性水平。
  • XGBoost:一个强大的梯度提升框架,用于处理各种类型的数据。在实验中,分别在不公平(包含受保护属性)和无感知(不包含受保护属性)设置下使用。
  • XGBoostLogistic Regression:逻辑回归是一种广泛应用于二元分类问题的统计方法。在实验中,使用逻辑回归来评估不公平、无感知和公平设置下的性能。

3.1.2.2 公平性模型

  • 公平 XGBoost: 使用公平性惩罚的 XGBoost 模型。
  • 公平 Logistic Regression: 使用公平性惩罚的 Logistic Regression 模型。

3.1.3 训练设置

  • 特征嵌入: 使用嵌入方法将类别特征转换为数值特征。
  • 类别不平衡: 使用过采样方法来处理类别不平衡问题。
  • 超参数调整: 使用 Optuna 库进行贝叶斯优化,以找到最佳的超参数设置。
  • 评估: 使用测试集评估模型的公平性和性能。

3.2 评估指标

3.2.1 公平性指标

  • 人口统计学平等性 (Demographic Parity, DP): 该指标衡量模型对不同性别群体预测结果的差异。理想情况下,DP 应该为 0,表示模型对不同性别的用户展示高级职位广告的概率相同。
  • 平等化机会 (Equal Opportunity): 该指标确保模型对不同性别群体预测正类结果的能力相同。然而,FairJob 论文没有使用该指标,因为它可能导致更多对弱势群体的误分类。
  • 平等化公平 (Equalized Odds): 该指标确保模型对不同性别群体预测正类和负类结果的能力相同。FairJob 论文也没有使用该指标,因为它可能导致更多对弱势群体的误分类。

3.2.2 性能指标

  • 负对数似然 (Negative Log-Likelihood, NLLH): 该指标衡量模型预测结果的准确度。NLLH 越低,模型的预测能力越强。
  • ROC 曲线下面积 (Area Under the ROC Curve, AUC): 该指标衡量模型区分正类和负类结果的能力。AUC 越高,模型的预测能力越强。
  • 点击-排名效用 (Click-Rank Utility, U): 该指标衡量模型推荐广告的点击率。U 越高,模型推荐的广告越受用户欢迎。
  • 产品-排名效用 (Product-Rank Utility, ˜U): 该指标考虑了选择偏差,衡量模型推荐广告的点击率。˜U 越高,模型推荐的广告越受用户欢迎,并考虑了选择偏差的影响。

3.3 实验结果

  • 基线模型: Dummy 模型在 DP 方面表现最佳,但在 NLLH 和 AUC 方面表现较差。XGBoost 模型在 NLLH 和 AUC 方面表现较好,但在 DP 方面表现较差。
  • 公平性模型: 使用公平性惩罚的模型在 DP 方面表现有所提高,但 NLLH 方面有所下降。公平性惩罚的 Logistic Regression 模型在 DP 和 ˜U 方面表现有所提高,同时 NLLH 方面下降较少。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1905415.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PingCAP 成为全球数据库管理系统市场增速最快的厂商

近日,Gartner 发布的《Market Share Analysis: Database Management Systems, Worldwide, 2023》(2024 年 6 月)报告显示:“2023 年全球数据库管理系统(DBMS)市场的增长率为 13.4%,略低于去年的…

排序 -- 计数排序以及对排序的总结

到了这篇文章就说明常见的排序我们就快要讲完了,那这篇文章我们就讲一下非比较排序--计数排序。 一、非比较排序 1.基本思想 计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。 操作步骤: 统计相同元素出现次数 根据统计的结果将序列…

LaTeX教程(014)-LaTeX文档结构(14)

LaTeX教程(014)- LaTeX \LaTeX LATE​X文档结构(14) 2.3.3 multitoc - 将目录设置为多栏 multitoc包的使用方法相当简单,只需要调用这个包,并将要设置为多栏(默认是双栏)的目录指定到包选项中即可。如\usepackage[toc]{multitoc},设置的就是…

25_嵌入式系统总线接口

目录 串行接口基本原理 串行通信 串行数据传送模式 串行通信方式 RS-232串行接口 RS-422串行接口 RS-485串行接口 RS串行总线总结 RapidIO高速串行总线 ARINC429总线 并行接口基本原理 并行通信 IEEE488总线 SCSI总线 MXI总线 PCI接口基本原理 PCI总线原理 PC…

jmeter-beanshell学习4-beanshell截取字符串

再写个简单点的东西,截取字符串,参数化文件统一用csv,然后还要用excel打开,如果是数字很容易格式就乱了。有同事是用双引号把数字引起来,报文里就不用加引号了,但是这样beanshell处理起来,好像容…

MATLAB中的SDPT3、LMILab、SeDuMi工具箱

MATLAB中的SDPT3、LMILab、SeDuMi工具箱都是用于解决特定数学优化问题的工具箱,它们在控制系统设计、机器学习、信号处理等领域有广泛的应用。以下是对这三个工具箱的详细介绍: 1. SDPT3工具箱 简介: SDPT3(Semidefinite Progra…

Nacos服务注册总流程(源码分析)

文章目录 服务注册NacosClient找看源码入口NacosClient服务注册源码NacosServer处理服务注册 服务注册 服务注册 在线流程图 NacosClient找看源码入口 我们启动一个微服务&#xff0c;引入nacos客户端的依赖 <dependency><groupId>com.alibaba.cloud</groupI…

Science Robotics 麻省理工学院最新研究,从仿真中学习的精确选择、定位和抓放物体的视触觉方法

现有的机器人系统在通用性和精确性两个性能目标上难以同时兼顾&#xff0c;往往会陷入一个机器人解决单个任务的情况&#xff0c;缺乏"精确泛化"。本文针对精准和通用的同时兼顾提出了解决方法。提出了SimPLE(Pick Localize和placE的仿真模拟)作为精确拾取和放置的解…

C# 如何获取属性的displayName的3种方式

文章目录 1. 使用特性直接访问2. 使用GetCustomAttribute()方法通过反射获取3. 使用LINQ查询总结和比较 在C#中&#xff0c;获取属性的displayName可以通过多种方式实现&#xff0c;包括使用特性、反射和LINQ。下面我将分别展示每种方法&#xff0c;并提供具体的示例代码。 1.…

【Spring Cloud】一个例程快速了解网关Gateway的使用

Spring Cloud Gateway提供了一个在Spring生态系统之上构建的API网关&#xff0c;包括&#xff1a;Spring 5&#xff0c;Spring Boot 2和Project Reactor。Spring Cloud Gateway旨在提供一种简单而有效的路由方式&#xff0c;并为它们提供一些网关基本功能&#xff0c;例如&…

轻松驾驭开发之旅:Maven配置阿里云CodeUp远程私有仓库全攻略

文章目录 引言一、为什么选择阿里云CodeUp作为远程私有仓库&#xff1f;二、Maven配置阿里云CodeUp远程私有仓库的步骤准备工作配置Maven的settings.xml文件配置项目的pom.xml文件验证配置是否成功 三、使用阿里云CodeUp远程私有仓库的注意事项 引言 在软件开发的世界里&#…

【Linux进程】命令行参数 环境变量(详解)

目录 前言 1. 命令行参数 什么是命令行参数? 2. 环境变量 常见的环境变量 如何修改环境变量? 获取环境变量 环境变量的组织方式 拓展问题 导入环境变量 3. 本地变量* 总结 前言 在使用Linux指令的时候, 都是指令后边根命令行参数, 每个指令本质都是一个一个的可执行程…

数学系C++ 排序算法简述(八)

目录 排序 选择排序 O(n2) 不稳定&#xff1a;48429 归并排序 O(n log n) 稳定 插入排序 O(n2) 堆排序 O(n log n) 希尔排序 O(n log2 n) 图书馆排序 O(n log n) 冒泡排序 O(n2) 优化&#xff1a; 基数排序 O(n k) 快速排序 O(n log n)【分治】 不稳定 桶排序 O(n…

Kaggle网站免费算力使用,深度学习模型训练

声明&#xff1a; 本文主要内容为&#xff1a;kaggle网站数据集上传&#xff0c;训练模型下载、模型部署、提交后台运行等教程。 1、账号注册 此步骤本文略过&#xff0c;如有需要可以参考其他文章。 2、上传资源 不论是上传训练好的模型进行预测&#xff0c;还是训练用的…

2024组装一台能跑AI大模型的电脑

title: 2024组装一台能跑AI大模型的电脑 tags: [组装电脑, AI大模型] categories: [其他, 电脑, windows] 这里不写组装步骤&#xff0c;哪里接线&#xff0c;购买什么品牌网上一大堆。 这里只写如何根据你自己的需求&#xff0c;选择合适的、兼容的配件。 概述 需求&#xff…

区间最值问题-RQM(ST表,线段树)

1.ST表求解 ST表的实质其实是动态规划&#xff0c;下面是区间最小的递归公式&#xff0c;最大只需将min改成max即可 f[i][j] min(f[i][j - 1], f[i (1 << j - 1)][j - 1]); 二维数组的f[i][j]表示从i开始连续2*j个数的最小/大值。 例如&#xff1a;我们给出一个数组…

iOS中多个tableView 嵌套滚动特性探索

嵌套滚动的机制 目前的结构是这样的&#xff0c;整个页面是一个大的tableView, Cell 是整个页面的大小&#xff0c;cell 中嵌套了一个tableView 通过测试我们发现滚动的时候&#xff0c;系统的机制是这样的&#xff0c; 我们滑动内部小的tableView, 开始滑动的时候&#xff0c…

【驱动篇】龙芯LS2K0300之ADC驱动

实验目的 由于LS2K0300久久派开发板4.19内核还没有现成可用的ADC驱动&#xff0c;但是龙芯官方的5.10内核已经提供了ADC驱动&#xff0c;想要在4.19内核使用ADC就要参考5.10内核移植驱动&#xff0c;本次实验主要是关于ADC驱动的移植和使用 驱动移植 主要的驱动代码主要有3个…

ASRock Creator系列GPU:为AI推理及多GPU系统打造,采用16针电源接口的Radeon RX 7900系列显卡

ASRock 正在筹备推出专为人工智能推理和多GPU系统设计的AMD GPU——Creator系列显卡。这一系列显卡采用双槽位、吹风式设计&#xff0c;并配备16针电源连接器&#xff0c;首发产品包括基于Navi 31架构的AMD Radeon RX 7900XTX和RX 7900 XT型号。这些原属于WS系列的显卡最初在20…

网络安全设备——防火墙

网络安全设备防火墙是一种用来加强网络之间访问控制的特殊网络互联设备。以下是对防火墙的详细解释&#xff1a; 一、定义与基本概念 定义&#xff1a;防火墙是指设置在不同网络&#xff08;如可信任的企业内部网和不可信的公共网&#xff09;或网络安全域之间的一系列部件的…