一、导论——可解释性机器学习(DataWhale组队学习)

news2024/11/25 22:36:04

目录

  • 导言
  • 一、什么是可解释人工智能?
  • 二、学可解释机器学习有什么用?
    • 2.1学习可解释机器学习的原因
    • 2.2 Machine Teaching :人工智能教人类学习
    • 2.3 细粒度图像分类
    • 2.4前沿AI
  • 三、本身可解释性好的机器学习模型
  • 四、传统机器学习算法的可解释性分析
  • 五、卷积神经网络的可解释性分析
    • 5.1可视化卷积核、特征图
    • 5.2遮挡Mask、缩放、平移、旋转
    • 5.3找到能使某个神经元激活的原图像素,或者小图
    • 5.4基于类激活热力图(CAM) 的可视化
    • 5.5语义编码降维可视化
    • 5.6由语义编码倒推输入的原图
    • 5.7生成满足某些要求的图像 (某类别预测概率最大)
  • 六、总结
  • 扩展阅读

导言

诺曼底登陆是一次巧妙的军事欺骗行为,利用一揽子欺骗计划赢得夺岛最佳时机,为战争胜利打下坚实基础。诺曼底登陆因此被称作“最大的军事欺骗”或“十大军事骗局之首”。在这里插入图片描述
  其中一条计划代号是卫士计划——“南方坚韧”之声东击西
  牵制住挪威,只是牵制住了德军一部分兵力,更重要的是进攻方向上的欺骗。盟军最终选择加来作为佯攻地点,在对岸多佛建立了第一集团军群的司令部,司令官是巴顿。战争前夕,他们开始大规模的建立营房、医院,弹药库,表面上看似十分逼真。该集团军人员共计3000名,其中2000名是发报人员,通过互传假情报欺骗德国电讯侦察人员。而有1000名是伪装人员,利用橡胶制作了大量的装备模型,坦克、飞机、大炮一应俱全,因此骗过了德军的空军侦察兵。由于巴顿在西西里岛战役中的出色表现,让德军误以为加来是盟军的主攻方向。
  到了60年代人工智能出现了,美国军方想利用神经网络来识别照片中的坦克是真坦克,在美国军方的测试集中有99%的准确率,但是在实际应用中的效果很差。造成这个结果的原因大家众说纷纭,神经网络就像一个黑箱子,没有人知道它究竟是怎么工作的,这正是可解释人工智能要解决的问题。


一、什么是可解释人工智能?

人工智能黑箱子灵魂之问

  • Al的脑回路是怎样的? Al如何做出决策?是否符合人类的直觉和常识?
  • Al会重点关注哪些特征,这些特征是不是真的有用?
  • 如何衡量不同特征对Al预测结果的不同贡献?
  • Al什么时候work,什么时候不work ?
  • AI有没有过拟合?泛化能力如何?
  • 会不会被黑客误导,让AI指鹿为马?
  • 如果样本的某个特征变大15,会对Al预测结果产生什么影响?
  • 如果Al误判,为什么会犯错?如何能不犯错?
  • 两个AI预测结果不同,该信哪一-个?
  • 能让AI把学到的特征教给人类吗?
    在这里插入图片描述
      无论是AI绘画还是最近大火的ChatGPT,我们只知道它们的效果很好,但是我们还是无法知道模型能表现这么好的原因。从上图我们可以看出AI绘画有时候生成的图片是看似合理但是经不起推敲的。
    在这里插入图片描述

  可解释性就是希望寻求对模型工作机理的直接理解,打破人工智能的黑盒子。

二、学可解释机器学习有什么用?

2.1学习可解释机器学习的原因

  • 可解释性学习满足选择研究方向时的一下条件:

    • 尽可能通用,与其它研究方向交叉
    • 顺应主流发展趋势,长期存在且有用
    • 有高质量的数据集
    • 不过分小众,但也好发paper,没有疯狂内卷
    • 能应用到产业界垂直细分行业
    • 有商业应用价值,容易“讲故事’
  • 研究AI的脑回路,就是研究AI的本质。

  • 可解释分析是机器学习和数据挖掘的通用研究方法。

  • 和所有Al方向交叉融合:数据挖掘、计算机视觉、自然语言处理、强化学习、知识图谱、联邦学习。

  • 包括但不限于:大模型、弱监督、缺陷异常检测、细粒度分类、决策Al和强化学习、图神经网络、Al纠偏、Al for Science、 Machine Teaching、 对抗样本、可信计算、联邦学习。

2.2 Machine Teaching :人工智能教人类学习

  1. 用AI学习鸟类的分类,让AI教会人类学习
    在这里插入图片描述
  2. 用可视化的方法,让神经网络教会人类如何预测工艺参数
    在这里插入图片描述
  3. 绝艺围棋AI指导棋:围棋定式、招式
    在这里插入图片描述
  4. 铁路轨道伤损识别
    在这里插入图片描述
  5. AI作画:指导人类绘画(百度文心)
    在这里插入图片描述

2.3 细粒度图像分类

  1. 花和叶子的识别
    在这里插入图片描述

  2. 荔枝的类别识别
    在这里插入图片描述

  3. 类似的海洋生物的识别
    在这里插入图片描述

  4. 韩国女星的识别
    在这里插入图片描述

  5. 奥特曼识别
    在这里插入图片描述

  6. X光胸片的肺炎判定
    在这里插入图片描述

  7. 工业缺陷的类激活图:用分类问题解决定位问题
    在这里插入图片描述

  8. 生物医学、生物信息学、基因数据挖掘、蛋白质结构预测领域
    在这里插入图片描述

2.4前沿AI

  1. ChatGPT聊天机器人
    在这里插入图片描述

  2. AI绘画

  3. 大模型:用海量数据、海量算力、海量参数进行训练
    在这里插入图片描述

  4. 蛋白质的空间预测(要运用大模型)
    在这里插入图片描述

三、本身可解释性好的机器学习模型

本身可解释性好的机器学习模型:KNN(k-最近邻算法)、Logistic回归算法、线性回归算法、决策树、朴素贝叶斯
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

四、传统机器学习算法的可解释性分析

  1. 算法自带的可视化
  2. 算法自带的特征权重
  3. Permutation Importance置换重要度
  4. PDP图、ICE图
  5. Shapley值
  6. Lime
    在这里插入图片描述

算法性能和可解释能力的关系
在这里插入图片描述

五、卷积神经网络的可解释性分析

  • 可视化卷积核、特征图
  • 遮挡Mask、缩放、平移、旋转
  • 找到能使某个神经元激活的原图像素,或者小图
  • 基于类激活热力图(CAM) 的可视化
  • 语义编码降维可视化
  • 由语义编码倒推输入的原图
  • 生成满足某些要求的图像 (某类别预测概率最大)

5.1可视化卷积核、特征图

  每个卷积核提取不同的特征,每个卷积核对输入进行卷积,生成一个feature map,这个feature map即提现了该卷积核从输入中提取的特征,不同的feature map显示了图像中不同的特征。

  • 浅层卷积核提取:边缘、颜色、斑块等底层像素特征
  • 中层卷积核提取:条纹、纹路、形状等中层纹理特征
  • 高层卷积核提取:眼睛、轮胎、文字等高层语义特征

最后的分类输出层输出最抽象的分类结果
在这里插入图片描述

5.2遮挡Mask、缩放、平移、旋转

在这里插入图片描述

在这里插入图片描述

5.3找到能使某个神经元激活的原图像素,或者小图

在这里插入图片描述

5.4基于类激活热力图(CAM) 的可视化

在这里插入图片描述

5.5语义编码降维可视化

在这里插入图片描述

5.6由语义编码倒推输入的原图

在这里插入图片描述

5.7生成满足某些要求的图像 (某类别预测概率最大)

在这里插入图片描述

逃逸攻击可分为白盒攻击和黑盒攻击。白盒攻击是在已经获取机器学习模型内部的所有信息和参数上进行攻击,令损失函数最大,直接计算得到对抗样本;黑盒攻击则是在神经网络结构为黑箱时,仅通过模型的输入和输出,逆推生成对抗样本。下图左图为白盒攻击(自攻自受),右图为黑盒攻击(用他山之石攻此山之玉)。
在这里插入图片描述
下面的图片就是一种快速梯度符号攻击,加了一部分噪声后,我们会发现,虽然人的判断还是正确的,但是人工智能的判断已经把pandas分类为gibbon长臂猿了。
在这里插入图片描述

六、总结

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

扩展阅读

子豪兄出品的可解释性分析代码:https://github.com/TommyZihao/Train_Custom_Dataset/图像分类
pytorch的可解释性分析库:
https://github.com/utkuozbulak/pytorch-cnn-visualizations
思考题
为什么要对机器学习、深度学习模型做可解释性分析和显著性分析 ?
如何回答“人工智能黑箱子灵魂之问” ?
人工智能的可解释性分析有哪些应用场景?
哪些机器学习算法本身可解释性就好?为什么?
对计算机视觉、自然语言处理、知识图谱、强化学习,分别如何做可解释性分析?
在你自己的研究领域和行业,如何使用可解释性分析?
可以从哪几个角度实现可解释性分析 ?
Machine Teaching有哪些应用场景 ?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/86408.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

前端基础(二)_HTML常用标签(块级标签、行级标签、行块级标签)

HTML常用标签 我们可以分为三类&#xff1a; 1.块级标签 2.行级标签 3.行块级标签 一、块级标签 1.1 h系类标签 标题标签 H1~h6 大到小 H1 在同一个页面中只能使用一次 其他标签可以重复 特点&#xff1a;默认宽度100% 高度自适应 独立成行 自带间距加粗 <body><…

java计算机毕业设计ssm制造型企业仓储管理系统i0180(附源码、数据库)

java计算机毕业设计ssm制造型企业仓储管理系统i0180&#xff08;附源码、数据库&#xff09; 项目运行 环境配置&#xff1a; Jdk1.8 Tomcat8.5 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&…

[附源码]计算机毕业设计的项目管理系统Springboot程序

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; Springboot mybatis MavenVue等等组成&#xff0c;B/S模式…

基于小波变换的图像压缩解压缩的matlab仿真

目录 1.算法描述 2.仿真效果预览 3.MATLAB核心程序 4.完整MATLAB 1.算法描述 图像压缩的类别 对于图像压缩&#xff0c;主要有两类方法&#xff1a;无损的图像压缩以及有损的图像压缩&#xff0c;分别称为lossless image compression and lossy image compression。 对于无…

[附源码]Node.js计算机毕业设计动漫网站Express

项目运行 环境配置&#xff1a; Node.js最新版 Vscode Mysql5.7 HBuilderXNavicat11Vue。 项目技术&#xff1a; Express框架 Node.js Vue 等等组成&#xff0c;B/S模式 Vscode管理前后端分离等等。 环境需要 1.运行环境&#xff1a;最好是Nodejs最新版&#xff0c;我…

第37篇 网络(七)TCP(一)

导语 TCP即TransmissionControl Protocol&#xff0c;传输控制协议。与UDP不同&#xff0c;它是面向连接和数据流的可靠传输协议。也就是说&#xff0c;它能使一台计算机上的数据无差错的发往网络上的其他计算机&#xff0c;所以当要传输大量数据时&#xff0c;我们选用TCP协议…

ssm+Vue计算机毕业设计校园生活服务预约管理系统(程序+LW文档)

ssmVue计算机毕业设计校园生活服务预约管理系统&#xff08;程序LW文档&#xff09; 项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;…

spring切入点表达式(一)

前面写到切入点表达式&#xff0c;如果把全部方法都作为切入点的话&#xff0c;用execution(* *(..))表达式&#xff0c;这个表达式代表什么意思呢&#xff1f; public void login (String name,String address){} * * ( . . ) * *(..)对应方法如上图 * -------->代表修…

【GRU回归预测】基于鲸鱼算法优化门控循环单元WOA-GRU神经网络实现多输入单输出回归预测附matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;修心和技术同步精进&#xff0c;matlab项目合作可私信。 &#x1f34e;个人主页&#xff1a;Matlab科研工作室 &#x1f34a;个人信条&#xff1a;格物致知。 更多Matlab仿真内容点击&#x1f447; 智能优化算法 …

网络协议—应用层的HTTPS协议

用 HTTP 协议&#xff0c;看个新闻还没有问题&#xff0c;但是换到更加严肃的场景中&#xff0c;就存在很多的安全风险。例如&#xff0c;你要下单做一次支付&#xff0c;如果还是使用普通的 HTTP 协议&#xff0c;那你很可能会被黑客盯上。例如在点外卖的环境中&#xff0c;发…

面试题 —— 真实面试题分享

文章目录 一、对BFC的理解。二、CSS中”::“和”:”的区别&#xff1f;三、对vue生命周期的理解&#xff1f; 四、vue组件通信的方式 五、vue中给data中的对象添加一个新的属性会发生什么&#xff0c;如何解决? 六.微信小程序组件的生命周期 七、javascript原型与继承的理解…

【vue基础】关于组件之间的通信

目录 &#xff08;1&#xff09;父组件向子组件传递信息 1.props&#xff1a; 2.第二种是直接从子组件里面利用&#xffe5;parent和root引用&#xff0c;获取根组件和父组件中的数据 &#xff08;2&#xff09;子组件数据传入父组件 1.通过自定义事件 2.通过$refs引用集合…

Docker-自定义镜像上传阿里云

目录 一、Docker制作jdk镜像 jdkv.1.0的制作 步骤 二&#xff0c;alpine制作jdk镜像 2.1 alpine Linux简介 2.2 基于alpine制作JDK8镜像 前期准备 2.3步骤 2.3.1.下载镜像 2.3.2.创建并编辑dockerfile 2.3.3.执行dockerfile创建镜像 2.3.4.创建并启动容器(可略) 2.3.5.进…

考虑碳交易机制的园区综合能源系统电热协同运行优化研究(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️❤️&#x1f4a5;&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑…

【加油站会员管理小程序】05 充值套餐功能

上一篇我们讲解了轮播图的开发,本篇我们讲解充值优惠功能的开发。 开发之前我们要思考如何展示信息,在我们的功能规划里,在首页部分是要展示三个充值的套餐信息。那这个套餐呢最好是存在数据源中,便于日后维护信息。 在应用的编辑器里,点击数据源的图标,我们创建一个数…

m最小二乘法自适应均衡误码率仿真,对比LS,DEF以及LMMSE三种均衡算法误码率

目录 1.算法描述 2.仿真效果预览 3.MATLAB核心程序 4.完整MATLAB 1.算法描述 信道估计是通信系统接收机的重要功能模块&#xff0c;主要是用来估计信号所经历信道的冲击响应&#xff0c;并用于后续的信道均衡处理&#xff0c;以便消除多径信号混叠造成的ISI。 信道估…

[附源码]Node.js计算机毕业设计二手车交易平台设计Express

项目运行 环境配置&#xff1a; Node.js最新版 Vscode Mysql5.7 HBuilderXNavicat11Vue。 项目技术&#xff1a; Express框架 Node.js Vue 等等组成&#xff0c;B/S模式 Vscode管理前后端分离等等。 环境需要 1.运行环境&#xff1a;最好是Nodejs最新版&#xff0c;我…

硕士生论文学习——基于孪生神经网络的改进模型在中文语义相似度上的研究

文章目录摘要2.2 孪生神经网络3.2 基于孪生ELETRA网络的语义相似度交互模型结构3.3 实验结果分析3.3.4 评价指标摘要 啥啊&#xff1a;两个文本之间的交互特征 LSTM 应用于孪生神经网络的特征提取层&#xff0c;可以获取到长文本的语义信息。 孪生神经网络的特征提取层&…

【kernel exploit】CVE-2022-25636 nftables OOB 写堆指针漏洞利用

影响版本&#xff1a;Linux 5.4-rc1~5.17-rc5。5.17-rc6 已修补。 测试版本&#xff1a;Linux-5.13.19 &#xff08;原作者在Ubuntu 21.10 内核版本 5.13.0-30 中测试&#xff0c;成功率40%&#xff0c;由于用到 msg_msg 对象&#xff0c;所以只能用 5.14 以前的内核版本进行测…

Linux 下复现 Google Chrome RCE

写在前面&#xff1a;网上大多都是windows下复现的&#xff0c;不过最近我在Linux中也遇到了低版本的chrome&#xff0c;想着这也是一个点&#xff0c;但是没想到技术不够&#xff0c;没搞出来&#xff0c;还是看大佬的文档慢慢学吧。。。 目录 一.环境搭建 1.1 环境信息 1.…