人工智能系统越来越擅长欺骗我们?

news2024/12/23 7:54:31

人工智能系统越来越擅长欺骗我们?

在这里插入图片描述
一波人工智能系统以他们没有被明确训练过的方式“欺骗”人类,通过为他们的行为提供不真实的解释,或者向人类用户隐瞒真相并误导他们以达到战略目的。

发表在《模式》(Patterns)杂志上的一篇综述论文总结了之前的研究,该论文指出,这个问题凸显了人工智能控制的难度,以及这些系统工作方式的不可预测性。

说到欺骗人类,或许表明这些模型是有意图的。他们没有,但人工智能模型会无意识地找到解决障碍的方法,以实现给定的目标。有时,这些变通方法会违背用户的期望,让人觉得具有欺骗性。

AI系统学会欺骗的一个领域是在游戏环境中,它们被训练成要赢的游戏,特别是那些涉及必须采取战略行动的游戏。

2022年11月,Meta宣布创造了Cicero,这是一款能够在《外交》(Diplomacy)在线版中击败人类的人工智能。《外交》是一款流行的军事战略游戏,玩家可以通过协商联盟来争夺对欧洲的控制权。

Meta的研究人员表示,他们已经在数据集的“真实”子集上训练Cicero,使其在很大程度上是诚实和有用的,并且为了成功,它“永远不会故意背后中伤”它的盟友。但这篇新论文的作者声称,事实恰恰相反:西塞罗违反了协议,说了彻头彻尾的谎言,并参与了有预谋的欺骗。作者表示,尽管该公司确实试图训练西塞罗诚实行事,但未能实现这一目标,这表明人工智能系统仍然可以出人意料地学会欺骗。

Meta既没有证实也没有否认研究人员关于Cicero表现出欺骗行为的说法,但一位发言人表示,这纯粹是一个研究项目,该模型只是为了玩《Diplomacy》而建立的。他们说:“我们根据我们长期以来对开放科学的承诺,在非商业许可下发布了这个项目的文物。”“Meta定期分享我们的研究结果,以验证它们,并使其他人能够负责任地利用我们的进步。我们没有计划在我们的产品中使用这项研究或其成果。”

但这并不是唯一一款AI通过“欺骗”人类玩家获得胜利的游戏。

AlphaStar是DeepMind为玩电子游戏《星际争霸2》(StarCraft II)而开发的人工智能,它非常擅长做出旨在欺骗对手的招式(即佯攻),击败了99.8%的人类玩家。在其他地方,另一个名为Pluribus的Meta系统在扑克游戏中成功地学会了虚张声势,以至于研究人员决定不公布它的代码,因为担心它会破坏在线扑克社区。

除了游戏,研究人员还列举了其他人工智能欺骗性行为的例子。OpenAI最新的大型语言模型GPT-4在一项测试中提出了谎言,该测试要求它说服人类为它解决验证码。在一次模拟演习中,该系统还涉及内幕交易。在模拟演习中,该系统被要求扮演一名受压股票交易员的身份,尽管从未被明确指示这样做。

人工智能模型有可能在没有任何指示的情况下以欺骗的方式行事,这一事实似乎令人担忧。麻省理工学院研究人工智能存在安全性的博士后彼得·s·帕克(Peter S. Park)参与了这个项目,他说,这主要源于最先进的机器学习模型所特有的“黑匣子”问题:我们不可能确切地说出它们是如何或为什么会产生这样的结果——或者它们是否会一直表现出这种行为。

他说:“仅仅因为你的人工智能在测试环境中有某些行为或倾向,并不意味着如果它被释放到自然环境中,同样的教训也会成立。”“没有简单的方法可以解决这个问题——如果你想知道人工智能一旦被部署到野外会做什么,那么你就必须把它部署到野外。”

我们将人工智能模型拟人化的倾向影响了我们测试这些系统的方式以及我们对它们能力的看法。毕竟,通过旨在衡量人类创造力的测试并不意味着人工智能模型实际上具有创造力。剑桥大学(University of Cambridge)人工智能研究员哈里•劳(Harry Law)表示,至关重要的是,监管机构和人工智能公司要仔细权衡这项技术对社会的潜在好处和造成伤害的可能性,并明确区分这些模型能做什么和不能做什么。他没有参与这项研究。“这些都是很难回答的问题,”他说。

他说,从根本上说,目前还不可能训练出一个在所有可能情况下都不会欺骗的人工智能模型。此外,除了放大偏见和错误信息的倾向之外,欺诈行为的潜在可能性是许多问题之一,这些问题需要在人工智能模型被信任用于现实世界的任务之前得到解决。

“这是一项很好的研究,表明欺骗是可能的,”劳说。“下一步将是尝试进一步弄清楚风险状况是什么,以及欺骗行为可能产生的危害有多大,以及以何种方式发生。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1806760.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

红黑树的介绍与实现

前言 前面我们介绍了AVL树,AVL树是一棵非常自律的树,有着严格的高度可控制!但是正它的自律给他带来了另一个问题,即虽然他的查找效率很高,但是插入和删除由于旋转而导致效率没有那么高。我们上一期的结尾说过经常修改…

Java SE(Java Platform, Standard Edition)

Java SE(Java Platform, Standard Edition) 是Java平台的一个版本,面向桌面应用程序、服务器和嵌入式环境。Java SE提供了开发和运行Java应用程序的基础API(Application Programming Interface,应用程序编程接口&…

Docker之路(三)docker安装nginx实现对springboot项目的负载均衡

Docker之路(三)dockernginxspringboot负载均衡 前言:一、安装docker二、安装nginx三、准备好我们的springboot项目四、将springboot项目分别build成docker镜像五、配置nginx并且启动六、nginx的负载均衡策略七、nginx的常用属性八、总结 前言…

【leetcode--盛水最多的容器】

给定一个长度为 n 的整数数组 height 。有 n 条垂线,第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。 找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。 返回容器可以储存的最大水量。 写出来了一半,想到用双指针&am…

大数据数仓的数据回溯

在大数据领域,数据回溯是一项至关重要的任务,它涉及到对历史数据的重新处理以确保数据的准确性和一致性。 数据回溯的定义与重要性 数据回溯,也称为数据补全,是指在数据模型迭代或新模型上线后,对历史数据进行重新处理…

VisionPro的应用和入门教程

第1章 关于VisionPro 1.1 康耐视的核心技术 1. 先进的视觉系统 康耐视的视觉系统结合了高性能的图像传感器、复杂的算法和强大的计算能力,能够实时捕捉、分析和处理高分辨率图像。其视觉系统包括固定式和手持式两种,适用于各种工业环境。无论是精密电…

centos7安装字体

1.安装命令 yum install fontconfig #字体库命令 yum install mkfontscale #更新字体命令2.安装字体(注意权限问题) 进入目录 /usr/share/fonts ,该目录是 centos7 字体库的默认安装目录。在该目录下创建一个文件夹 ekp (名字…

C++从入门到精通(最详细教程,12万总结,带你掌握c++知识,涵盖大量知识点)

目录 一、面向对象的思想 二、类的使用 1.类的构成 2.类的设计 三、对象的基本使用 四、类的构造函数 1.构造函数的作用 2.构造函数的特点 3.默认构造函数 3.1.合成的默认构造函数 3.2.手动定义的默认构造函数 四、自定义的重载构造函数 五、拷贝构造函数 1.手动…

312. 戳气球 Hard

有 n 个气球,编号为0 到 n - 1,每个气球上都标有一个数字,这些数字存在数组 nums 中。 现在要求你戳破所有的气球。戳破第 i 个气球,你可以获得 nums[i - 1] * nums[i] * nums[i 1] 枚硬币。 这里的 i - 1 和 i 1 代表和 i 相邻…

设计模式之观察者模式ObserverPattern(十一)

一、概述 观察者模式 (Observer Pattern) 是一种行为型设计模式,又被称为发布-订阅 (Publish/Subscribe) 模式,它定义了对象之间的一种一对多的依赖关系,使得当一个对象的状态发生变化时,所有依赖于它的对象都会自动收到通知并更新…

Sui Generis如何为艺术家弥合Web3的鸿沟

Sui Generis是一家于3月推出的NFT拍卖行,其联合创始人兼CEO Gab9说其愿景是——更好、更大、更强! 表面上看,Sui Generis是备受欢迎的Tombheads NFT拍卖行的重新品牌化,该拍卖行今年早些时候从Fantom区块链迁移出来。但它于3月31…

Ajax 快速入门

Ajax 概念:Ajax是一种Web开发技术,允许在不重新加载整个页面的情况下,与服务器交换数据并更新网页的部分内容。 作用: 数据交换:Ajax允许通过JavaScript向服务器发送请求,并能够接收服务器响应的数据。 异…

从GAN到WGAN(01/2)

从GAN到WGAN 文章目录 一、说明二、Kullback-Leibler 和 Jensen-Shannon 背离三、生成对抗网络 (GAN)四、D 的最优值是多少?五、什么是全局最优?六、损失函数代表什么?七、GAN中的问题 一、说明 生成对抗网络 &#…

开源项目学习——vnote

一、介绍 vnote是一款免费且开源的markdown编辑器,用C开发,基于Qt框架,windows/linux/mac都能用。 二、编译 $ git clone --recursive https://github.com/vnotex/vnote.git $ cd vnote && mkdir build $ cd build $ cmake ../ $ …

【端午安康,给大家讲个“网络”故事,深刻一下!】

牛马我🐴上周又挨锤了, 网络是不稳定的,博学多知的你可能知道,可能不知道。但假如没亲身经历过,知不知道都不深刻,牛马踩了个网络的坑,深刻了,这里分享下, 一个真相 无…

【算法训练记录——Day27】

Day27——回溯算法Ⅲ 1.组合总和2.组合总和II3.分割回文串 内容 ● 39.组合总和 ● 40.组合总和II ● 131.分割回文串 1.组合总和 思路&#xff1a;和组合总和一样&#xff0c;先从candidates中遍历选择元素&#xff0c;但是纵向递归时所选择元素要包括当前元素 vector<int&…

289M→259M得物包体积治理实践

一、前言 iOS应用的包体积大小是衡量得物性能的重要指标&#xff0c;过大包体积会降低用户对应用的下载意愿&#xff0c;还会增加用户的下载等待时间以及用户手机的存储空间&#xff0c;本文重点介绍在包体积治理中的新思路以及原理与实践。 二、原理介绍 Macho产物测试 我…

什么是档案数字化管理

档案数字化管理指的是将传统的纸质档案转换为数字形式&#xff0c;并通过电子设备、软件和网络技术进行管理和存储的过程。 档案数字化管理包括以下几个步骤&#xff1a; 1. 扫描和数字化&#xff1a;将纸质档案通过扫描仪转换为数字图像或文档。可以使用OCR&#xff08;光学字…

AI论文速读 | 2024[ICML]FlashST:简单通用的流量预测提示微调框架

题目&#xff1a; FlashST: A Simple and Universal Prompt-Tuning Framework for Traffic Prediction 作者&#xff1a;Zhonghang Li, Lianghao Xia&#xff08;夏良昊&#xff09;, Yong Xu&#xff08;徐勇&#xff09;, Chao Huang 机构&#xff1a;华南理工大学&#xf…

搜索与图论:深度优先搜索

搜索与图论&#xff1a;深度优先搜索 题目描述参考代码 题目描述 参考代码 #include <iostream>using namespace std;const int N 10;int n; int path[N]; bool st[N];void dfs(int u) {// u n 搜索到最后一层if (u n){for (int i 0; i < n; i) printf("%d …