如何利用 Smarter Balanced 塑造教育领域的 AI 治理

news2024/11/20 6:33:29

目录

定义挑战

以人为本的设计引领

融入多样性

探索以学生为中心的价值观

探索效果的层次和不同的影响


部位于加利福尼亚州的Smarter Balanced Assessment Consortium 是一个由会员主导的公共组织,为 K-12 和高等教育领域的教育工作者提供评估系统。该组织成立于 2010 年,与州教育机构合作开发创新的、符合标准的考试评估系统。Smarter Balanced 为教育工作者提供工具、课程和资源,包括形成性、中期和总结性评估,帮助教育工作者发现学习机会并加强学生的学习。

Smarter Balanced 致力于在不断变化的教育环境中不断发展和创新。通过与IBM Consulting® 的合作,该公司旨在探索在教育评估中使用人工智能 (AI) 的原则性方法。该合作于 2024 年初宣布,目前仍在进行中。

定义挑战

传统的针对 K-12 学生的技能评估,包括标准化考试和结构化测验,因与公平性相关的各种原因而受到批评。如果负责任地实施,人工智能具有变革性的潜力,可以提供个性化的学习和评估体验,以提高包括边缘群体在内的学生群体的评估公平性。因此,核心挑战是定义在学校环境中负责任地实施和治理人工智能是什么样子。

作为第一步,Smarter Balanced 和 IBM Consulting 成立了一个多学科咨询小组,其中包括教育测量、人工智能、人工智能伦理和政策以及教育工作者方面的专家。该小组的目标是制定指导原则,将准确性和公平性融入到人工智能用于教育测量和学习资源的过程中。下面概述了咨询小组的一些考虑因素。

以人为本的设计引领

使用设计思维框架可帮助组织制定以人为本的技术实施方法。三项以人为本的原则指导设计思维:关注用户成果、不断创新和赋予多元化团队权力。该框架有助于确保利益相关者在战略上保持一致,并响应功能性和非功能性组织治理要求。设计思维使开发人员和利益相关者能够深入了解用户需求、构思创新解决方案并迭代原型。

这种方法对于在开发过程的早期识别和评估风险以及促进创建值得信赖且有效的 AI 模型具有重要意义。通过不断与不同领域的专家和其他利益相关者社区进行接触并采纳他们的反馈,设计思维有助于构建技术可靠、对社会负责且以人为本的 AI 解决方案。

融入多样性

对于 Smarter Balanced 项目,联合团队成立了一个智囊团,其中包括各领域的专家和思想领袖。这个小组由教育评估和法律、神经多样性人群、学生、有无障碍障碍的人和其他领域的专家组成。

智库成员、马克库班基金会人工智能训练营项目架构师夏洛特·邓根 (Charlotte Dungan) 表示:“Smarter Balanced AI 智库致力于确保人工智能值得信赖且负责任,并确保我们的人工智能能够增强学生的学习体验。”

该智库的目标不是简单地将其成员的专业知识、观点和生活经验以“一次性”的方式纳入治理框架,而是不断迭代。这种方法反映了 IBM 人工智能伦理的一个关键原则:人工智能的目的是增强人类智能,而不是取代它。包含来自不同利益相关者的持续投入、评估和审查的系统可以更好地培养信任并促进公平的结果,最终创造一个更具包容性和有效性的教育环境。

这些系统对于在小学环境中创建公平有效的教育评估至关重要。多元化的团队带来了广泛的观点、经验和文化见解,这对于开发代表所有学生的 AI 模型至关重要。这种包容性有助于最大限度地减少偏见,并构建不会无意中延续不平等或忽视不同人口群体独特需求的 AI 系统。这反映了 IBM AI 伦理的另一个关键原则:  AI 多样性的重要性不在于观点,而在于数学。

探索以学生为中心的价值观

Smarter Balanced 和 IBM Consulting 作为一个团队开展的首批工作之一是确定我们希望在 AI 模型中看到的人类价值观。这不是一个新的道德问题,因此我们确定了一组与 IBM 的AI 支柱(或可信赖 AI 的基本属性)相对应的价值观和定义:

  • 可解释性:具有可以非技术性解释的功能和结果
  • 公平:平等对待他人
  • 稳健性:安全可靠,抵抗对抗性攻击
  • 透明度:披露人工智能的使用情况、功能和数据使用情况
  • 数据隐私:披露和维护用户的隐私和数据权利

在任何组织中实施这些价值观都是一项挑战。在评估学生技能的组织中,标准甚至更高。但人工智能的潜在优势使这项工作值得:“借助生成式人工智能,我们有机会更好地吸引学生,通过及时和可操作的反馈准确评估他们,并培养通过人工智能工具积极增强的 21 世纪技能,包括创造力、批判性思维、沟通策略、社交情感学习和成长心态,”Dungan 说。下一步是探索和定义将指导使用人工智能评估儿童和年轻学习者的价值观,目前正在进行中。

团队正在努力解决的问题包括:

  • 为了负责任地培养这些技能,需要哪些价值观驱动的护栏?
  • 它们将如何运作和管理,谁应该负责?
  • 我们给构建这些模型的从业者什么指导?
  • 哪些功能性和非功能性要求是必要的,以及强度级别是多少?

探索效果的层次和不同的影响

在本次练习中,我们采用了一种名为“效果层”的设计思维框架,这是IBM® Design for AI向开源社区Design Ethically捐赠的几个框架 之一。效果层框架要求利益相关者考虑其产品或体验的主要、次要和第三级影响。

  • 主要效果描述的是产品(在本例中为 AI 模型)的预期已知效果。例如,社交媒体平台的主要效果可能是将兴趣相投的用户联系起来。
  • 次要影响不是刻意为之,但很快就会引起利益相关者的关注。继续以社交媒体为例,次要影响可能是平台对广告商的价值。
  • 第三效应是随着时间的推移而变得明显的非预期或未预见到的效应,例如社交媒体平台倾向于奖励那些具有更高浏览量的令人愤怒的帖子或虚假信息。

对于这种用例,人工智能增强测试评估系统的主要(期望)效果是成为一种更公平、更具代表性和更有效的工具,从而改善整个教育系统的学习成果。

次要影响可能包括提高效率和收集相关数据,以帮助在最需要的地方更好地分配资源。

第三效应可能是已知的,也可能是非预期的。利益相关者必须探索潜在的非预期危害可能是什么样子。

研究小组确定了五类潜在的高级别危害:

  • 有害偏见考虑没有考虑或支持来自弱势群体的学生,这些学生可能需要额外的资源和观点来满足他们的不同需求。
  • 学校系统中缺乏针对其设备和网络的适当程序,存在与网络安全和个人身份信息 (PII) 相关的问题。
  • 缺乏治理和护栏来确保人工智能模型继续按照预期的方式运行。
  • 缺乏与家长、学生、教师和管理人员就学校中人工智能系统的预期用途进行适当沟通。这些沟通应该描述防止不当使用的保护措施和机构,例如如何选择退出。
  • 校外连接有限可能会减少技术的获取以及随后的人工智能的使用,尤其是在农村地区。

差异影响评估最初应用于法律案件,可帮助组织识别潜在偏见。这些评估探索看似中立的政策和做法如何对受保护群体产生不成比例的影响,例如那些容易受到基于种族、宗教、性别和其他特征的歧视的人。事实证明,此类评估在制定与招聘、贷款和医疗保健相关的政策方面非常有效。在我们的教育用例中,我们试图考虑那些可能因其情况而遭受不公平评估结果的学生群体。

被确定最容易受到潜在伤害的群体包括:

  • 那些有心理健康问题的人
  • 来自不同社会经济背景的人,包括没有住房的人
  • 主要语言不是英语的人
  • 有其他非语言文化考虑的人
  • 患有神经多样性疾病或有行动障碍的人

作为一个集体,我们的下一组练习是使用更多的设计思维框架(例如道德黑客)来探索如何减轻这些危害。我们还将详细说明寻求在学生评估中使用人工智能的组织的最低要求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2132433.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

09_Tensorflow2图像处理大赏:让你的图片笑出AI感,惊艳朋友圈!

1. 图像处理案例 1.1 逆时针旋转90度 import tensorflow as tf import matplotlib.pyplot as plt import matplotlib.cm as cm import numpy import osdef show_pic(pic,name,cmapNone):显示图像plt.imshow(pic,cmapcmap) plt.axis(off) # 打开坐标轴为 on # 设置图像标题…

C语言数据类型、变量及数据类型的长度、取值范围

文章目录 一、数据类型介绍1.字符型2.整型3.浮点型4.布尔类型 二、变量1.变量的创建2.变量的分类 三、数据类型的长度(字节)1.sizeof 操作符2.各种数据类型的长度3.sizeof中表达式不计算 四、各种类型的取值范围1.signed和unsigned2.数据类型的取值范围 五、整型提升练习1练习2…

【Obsidian】当笔记接入AI,Copilot插件推荐

当笔记接入AI,Copilot插件推荐 自己的知识库笔记如果增加AI功能会怎样?AI的回答完全基于你自己的知识库余料,是不是很有趣。在插件库中有Copilot插件这款插件,可以实现这个梦想。 一、什么是Copilot? 我们知道githu…

el-input-number设置了min值,希望默认值展示为空

data() {return {editForm: {num: undefined, //input}} } <el-input-number v-model.trim"editForm.num" controls-position"right" :min"1" placeholder"请输入" clearable /> 展示效果如下:

C++中的左值(Lvalue)和右值(Rvalue)详解

C中的左值&#xff08;Lvalue&#xff09;和右值&#xff08;Rvalue&#xff09;详解 在C中&#xff0c;左值&#xff08;Lvalue&#xff09;和右值&#xff08;Rvalue&#xff09;的概念是理解表达式和变量的重要基础。为了提高C的性能和灵活性&#xff0c;C11引入了一些新的…

F1C100S/F1C200S的资料来源说明

文章目录 常用板子开源创客荔枝派榴莲派 我想说是的官网啥资料都没有。但是它的资料又很多&#xff0c;从淘宝或者其他地方能都搜到很多。 http://wiki.lcmaker.com/index.php?titleLC-PI-200S https://github.com/peng-zhihui/Planck-Pi?tabreadme-ov-file#head4 http://do…

时序必读论文04|Non-stationary Transformers:序列平稳性优化【NeurIPS 2022】

我们在先前的一篇文章中已经总结了直接把Transformer应用到时间序列数据存在的问题&#xff0c;其中序列平稳化是transformer也是其他很多模型都未解决好的一个不足。实际上&#xff0c;序列平稳和非平稳是矛盾的存在&#xff0c;这篇文章探索了&#xff1a;原始数据-->平稳…

python基础知识(四)--if语句,for\while循环

目录 if语句 if-else语句 if...elif...else...语句的语法 if嵌套语句语法 while循环 死循环 for循环 例题&#xff1a; 1.请使用*代替&#xff0c;并输出一个正方形的显示效果。 2.逢7必过的游戏 3.九九乘法表 4.案例: 逢七必过游戏 [0, 999] 碰到特殊天气, 150 就…

停车位检测-停车场车位识别

YOLO Parking Spot 概述 停车场获取的图像训练了四个YOLO模型来检测车辆。目标是收集信息&#xff0c;并可能开发一种停车解决方案以改善交通流量并优化空间利用率。通过识别汽车&#xff0c;我们生成了一份报告&#xff0c;其中包含图像细节&#xff0c;如可用停车位的数量、…

Ai+若依(智能售货机运营管理系统---帝可得)--工单管理【08篇---0005:工单管理】

工单管理 需求说明 工单是一种专业名词,是指用于记录、处理、跟踪一项工作的完成情况。 管理人员登录后台系统选择创建工单,在工单类型里选择合适的工单类型,在设备编号里输入正确的设备编号。 工作人员在运营管理App可以看到分配给自己的工单,根据实际情况选择接收工单并…

复现PointNext代码

一、首先第一步&#xff0c;我们就需要下载代码&#xff1a;guochengqian/PointNeXt: [NeurIPS22] PointNeXt: Revisiting PointNet with Improved Training and Scaling Strategies (github.com) 二、然后下载好了之后&#xff0c;然后最关键的一点&#xff0c;这个点进去也要…

【LeetCode每日一题】2024年9月第二周(上)

2024.9.9 中等 难度评分 1333 链接&#xff1a;2181. 合并零之间的节点 &#xff08;1&#xff09;题目描述&#xff1a; &#xff08;2&#xff09;示例 &#xff08;3&#xff09;分析 整体来说&#xff0c;描述还算清晰的题目&#xff0c;找到0节点所框定的区域&#xff0c…

起重机检测系统源码分享

起重机检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer Visio…

@Valid @NotBlank @NotEmpty @NotNull不生效问题

Spring Boot2.3版本将不再内部依赖validator了 所以导致校验的注解不生效 解决方案&#xff1a;加入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-validation</artifactId> </dependency&…

C++提高--模板(类模板/函数模板)

模板的概念 函数模板(将类型参数化) 函数模板语法 两个函数逻辑非常相似 #define _CRT_SECURE_NO_WARNINGS #include<iostream> using namespace std; // 模板// 交换两个数 void swapInt(int& a, int& b) {int temp a;a b;b temp; } void swapDouble(doubl…

力扣121-买卖股票的最佳时机(Java详细题解)

题目链接&#xff1a;121. 买卖股票的最佳时机 - 力扣&#xff08;LeetCode&#xff09; 前情提要&#xff1a; 因为本人最近都来刷dp类的题目所以该题就默认用dp方法来做。 dp五部曲。 1.确定dp数组和i下标的含义。 2.确定递推公式。 3.dp初始化。 4.确定dp的遍历顺序。…

踩最深的坑,教会自己找到需求

目录 引言 1. 寻找合适的需求 2. 海外市场选择 3. 线下热点判断 4. 线上关注度分析 5. 当前竞争分析 6. 未来潜力分析 引言 在经历了刻骨铭心的合伙创业经历后&#xff0c;我意识到是时候该独立出海了。 捡起早已深埋在心里的创业想法&#xff0c;开始独自创业。 这次…

用“女神的一群舔狗”的例子深入理解线程池

假如有一个妹子&#xff08;肤白貌美身材好&#xff09; 同一时间只能谈一个对象&#xff0c;但是新鲜感过去之后就没什么意思了&#xff0c;就想换个对象&#xff0c;但是更换对象的操作效率比较低&#xff0c;需要做到&#xff1a; 1. 想办法和现有对象分手 2.吸引到下一个舔…

高低压配电系统中电弧光的危害有多大?

摘要 故障电弧是一种常见的电气故障现象&#xff0c;尤其在配电系统中&#xff0c;可能对设备安全和电力供应造成严重影响。本文旨在探讨故障电弧对配电系统的危害&#xff0c;并提出相应的预防措施&#xff0c;以增强系统的可靠性和安全性。通过对故障电弧的形成机制、危害分…

软件设计师试题

1、以下关于RISC&#xff08;精简指令集计算机&#xff09;特点的叙述中&#xff0c;错误的是&#xff08; B &#xff09;。 A.对存储器操作进行限制&#xff0c;使控制简单化 B.指令种类多&#xff0c;指令功能强 C.设置大量通用寄存器 D.选取使用频率较高的一些指令&…