针对航空安全风险分析和飞行技术评估问题的题解

news2024/11/24 10:52:19

文章目录

  • 针对航空安全风险分析和飞行技术评估问题的题解
    • 思路
  • 文章最下方

针对航空安全风险分析和飞行技术评估问题的题解

最新进度在文章最下方卡片,加入获取思路数据代码论文:2023十三届MathorCup交流
(第一时间在CSDN分享,文章底部)

在这里插入图片描述

思路

问题一可以分为两小问,首先需要进行数据预处理,其中特别的要针对错误数据进行分析,剔除,这个过程也就是提到的可靠性研究。
常见的剔除数据的方法就是使用箱型图剔除异常值,如下是一个简单的箱形图:

将一组数据从大到小排列,分别计算出,
上四分位数 3: 75%分位点所对应的值
中位数 2: 50%分位点对应的值
下四分位数 1: 25%分位点所对应的值
上边缘(须): Q3+1.5(Q3-Q1)
下边缘(须): Q1-1.5(Q3-Q1)
数据 的合理范围为:

和使用3σ准则剔除异常值相比,箱形图不需要数据服从正态分布,能真实直观的表现数据形状;箱线图以四分位数和四分位距作为判断异常值的标准,四分位数具有一定的耐抗性,多达 25%的数据可以变得任意远而不会很大地扰动四分位数,使得异常值无法对数据形状造成巨大影响,因此箱形图识别异常值的结果比较客观。
通过此方法剔除附件1的异常数据,然后题目需要对数据质量进行可靠性研究,这里就分析哪几个指标的数据异常值多,更加分散即可。另外,对于一些离散型数据,比如二值数据等,如果想要检测异常值,只能以其他指标作为输入,当前指标为输出进行预测。查看预测值与真实值的差异来判断,不建议这么做。
针对第一问的第二小问,即提取与飞行安全相关的部分关键数据项,并对其重要程度进行分析,这部分可以使用相关性分析来提取重要程度,这一部分可以使用相关性的热力图进行可视化,即下图这种。根据目标指标的相关性系数排序,来确定重要程度。同样的,这里也可以使用一些其他的评价类算法,比如灰色综合评价法、模糊综合评价法等方式进行重要程度的排序与建模。

在第一问开始前,最好对数据集做一个初步的EDA(探索性数据分析),包括一些数据可视化。包含但不限于:
数据量、特征数量、数据类型
数据分布情况(标准差、分位数、最大最小值)
重复值处理(保留、删除):假如你想发现某个用户的行为模式,该用户在不同的时间点进行相同的操作,那这个重复值是不是能帮助你获取该用户的行为偏好(你的问题),那可以保留
异常值处理(保留、删除):假如你正在做异常检测的任务,那这个信息能帮助你进行有效的数据标注(你的需要)
缺失值处理(删除、填充)
这里推荐的数据可视化方法有:
单变量可视化:查看数据分布-直方图、箱线图
两个变量的可视化:相关性分析-线图、散点图、热力图,比如:

问题二(小部分)分析:量化描述可以通过变化率、阈值等进行描述,在判断时同样根据这些指标来分辨,可以在这里设置置信区间等方式。这里可能需要进行算法准确率的分析。有时间,可以使用时间序列分析(比如arima)
这里可以做置信度、置信区间分析。还可以划分训练集、测试集来直接计算精确率。这里还可以可视化ROC曲线等。
1.精确率(precision)
就precision而言有很多版本,各种说法不一,有精确率也有正确率更有甚者把准确率也搞出来了实在受不了,反正咱们看英文precision。
precision是表示预测为正样本中,被实际为正样本的比例。可以看出precision是考虑的正样本被预测正确的比例.根据图1-1可得其计算公式为:P = TP / (TP + FP)
2. 召回率(recall)
召回率是表示实际为正样本中,预测为正样本的比例。可以看出,召回率考虑的是正样本的召回的比例.根据图1-1可得其计算公式为:P = TP / (TP + FN)
3.准确率(accuracy)
准确率表示所有的预测样本中,预测正确的比例.其计算公式为:A = (TP + TN) / (TP + FN + FP + TN)
总结:精确率(accuracy)和召回率(recall)计算公式的分子都是TP也就是正样本被预测为正样本的数量,可知其为正样本的精确率和正样本的召回率.而准确率(accuracy)主要表征的是整体预测正确的比例.

以上仅为第一、二问部分思路(后续完善),剩余部分思路、数据集和其他具体配套代码、参考论文,以及其他题目思路,还在本页面获得。
问题四:
这一题可以通过统计建模来计算,可以通过卡方检验研究其整体的差异,再通过列比例研究变量下各分组之间具体的差异,再接着用TGI对差异程度进行形容。、

文章最下方

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/424639.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VFP读写t5557卡示例源码

T5557卡是美国Atmel公司生产的多功能非接触式射频卡芯片,属于125KHz的低频卡,在国内有广大的应用市场。该芯片共有330bit(比特)的EPROM(分布为10个区块, 每个区块33bit)。0页的块0是被保留用于设置T5557操作模式的参数配置块。第0页第7块可以作用户数据块…

Excel表格怎么换行?4个方法任你选!

案例:excel表格怎么换行 【作为一名excel新手,我真的要被各种功能整懵了!今天又遇到了一个难题!excel表格怎么换行呀?各位大神帮帮我!】 在excel表格中进行换行操作是一种常见的需求,可以使单…

三分天下、格局初定,AR产业千亿市场谁执牛耳?

文|智能相对论 作者| 青月 【这是聚焦智能车与家的“智能相对论”关于创新硬件赛道的第27篇行业分析。】 早在十一年前,谷歌就推出了第一款AR眼镜Google Glass。 可由于当时1500美元的高昂价格,以及并不令人惊艳的体验,这款产品并未俘获消…

Flink1.14 Standalone独立集群模式安装

一、下载 在Flink 官网下载Flink 1.14,完整的安装包名是:flink-1.14.4-bin-scala_2.11.tgz。 二、master 配置 解压安装包,编辑conf/flink-conf.yaml文件: vim conf/flink-conf.yaml jobmanager.rpc.address: 172.21.0.XX tas…

N9010B频谱分析仪

N9010B N9010B EXA 信号分析仪,多点触控,10 Hz 至 44 GHz EXA X系列信号分析仪,多点触摸N9010B 本配置指南将帮助您确定哪些性能选项、测量应用程序、附件和服务将包含在新的多点触摸EXA中,或作为现有EXA的升级添加。主要特性和…

SSM实战-外卖项目-06-用户地址簿功能、菜品展示、购物车、下单

文章目录外卖项目-第六天课程内容1. 用户地址簿功能1.1 需求分析1.2 数据模型1.3 导入功能代码1.4 功能测试 (其实需求分析里我就自己写了一份代码,而且测试过了,下面再测试了一遍)2. 菜品展示2.1 需求分析2.2 前端页面分析2.3 代…

公开下载 | 300+页《服务端开发与面试知识手册》,12.8w字经典架构知识

淘苏(花名)目前是大淘宝技术的一名开发工程师。从国企跳槽来到互联网,【职业规划】是他被问得最多,也思考得最多的问题。回忆国企的三到五年时间,他完成了最初始的技术和经验的积累。接下来的职业生涯规划里&#xff0…

Linux_红帽8学习笔记分享_3

Linux_红帽8学习笔记分享_3 文章目录Linux_红帽8学习笔记分享_31.Vi编辑器1.1两种模式1.2十种技巧2.用户的家目录2.1 su命令的使用2.2 id命令的使用3. 重定向技术3.1查看文件内容的命令3.1.1 cat命令的使用3.1.2 more命令的使用3.2重定向概念3.2输出重定向符3.3标准追加重定向符…

小鹏开启架构造车,冲击年销300万台入场券

作者 | 张祥威 编辑 | 德新2023上海车展开始前,小鹏汽车发布了新一代技术架构SPEA 2.0扶摇。 扶摇是一次重要转向。基于这一新架构,小鹏的整车综合研发成本可以降低50%,接下来将有10多款新车密集投放。 大众进入电动化时代后&#xff0c…

插件化之APK动态加载

插件化相关概念: 根据组件化与插件化的区别来了解一下概念 组件化和插件化的区别 组件化:是将一个APP分成多个模块,每个模块都是一个组件(module),开发的过程中我们可以让这些组件相互依赖或者单独调试部分组件,但是最终发布的…

故障注入测试的作用和应用你了解多少?

故障注入是一种测试技术,用于模拟系统或应用程序中的故障。故障注入测试通常被用来评估系统或应用程序的可靠性和鲁棒性,以便确定系统或应用程序是否能够在各种异常情况下正常运行,那故障注入测试的作用和应用你了解多少? 故障注入…

苹果智能眼镜新技术曝光,智能穿戴与苹果Find My技术相结合

知名分析师郭明錤发文表示,苹果正在开发“超透镜”(metalens)技术,预计将于2024年实现量产,用于取代iPad的Face ID Tx的塑胶镜头,并将大量应用于Apple Glasses上。据悉,Apple Glasses(非AR/MR头显)预计最快在2026或202…

国网B接口语音对讲和广播技术探究及与GB28181差别

接口描述 在谈国网B接口的语音广播和语音对讲的时候,大家会觉得,国网B接口是不是和GB28181大同小异?实际上确实信令有差别,但是因为要GB28181设备接入测的对接,再次做国网B接口就简单多了。 语音对讲和广播包括信令接…

小白学Pytorch系列--Torch.optim API Scheduler(4)

小白学Pytorch系列–Torch.optim API Scheduler(4) 方法注释lr_scheduler.LambdaLR将每个参数组的学习率设置为初始lr乘以给定函数。lr_scheduler.MultiplicativeLR将每个参数组的学习率乘以指定函数中给定的因子。lr_scheduler.StepLR每个步长周期衰减每个参数组的学习率。lr_…

RFID技术在智慧图书馆盘点系统中的优势

RFID射频识别及技术,作为一种新兴的非接触式的自动识别技术,其基本原理是电磁理论,因其操作便捷高效,无需人工干预,可在各种恶劣环境下,通过射频信号自动识别目标并获取相关数据,可识别高速运动…

LightGBM论文翻译

0.摘要 Gradient Boosting Decision Tree (GBDT)是一个非常流行的机器学习算法,却只有像XGBoost和pGBRT的一些实现。尽管许多工程上的优化方案已经在这些实现中应用了,但是当特征维度较高和数据量巨大的时候,仍然存在效率和可扩展性的问题。…

家庭智能插座一Homekit智能

传统的灯泡是通过手动打开和关闭开关来工作。有时,它们可以通过声控、触控、红外等方式进行控制,或者带有调光开关,让用户调暗或调亮灯光。 智能灯泡内置有芯片和通信模块,可与手机、家庭智能助手、或其他智能硬件进行通信&#x…

L2-031 深入虎穴

著名的王牌间谍 007 需要执行一次任务,获取敌方的机密情报。已知情报藏在一个地下迷宫里,迷宫只有一个入口,里面有很多条通路,每条路通向一扇门。每一扇门背后或者是一个房间,或者又有很多条路,同样是每条路…

电脑频繁出现0x0000000A蓝屏错误怎么重装系统?

电脑频繁出现0x0000000A蓝屏错误怎么重装系统?有的小伙伴使用电脑的时候,总是会出现蓝屏的问题,导致自己不得不进行系统的重装。遇到这个情况只能是使用U盘来进行系统的重装了。一起来看看以下的具体操作方法教学吧。 准备工作: 1…

ClickHouse实现大数据探索性分析

分析数据一般会从探索性分析开始,即尝试理解数据本身的概况。通常包括中位数、平均值或分布情况,Python Numpy/Pandas很容易实现,但如果数据量为Tb级,不能简单依赖RAM工具实现。ClickHouse提供的强大的工具来挖掘数据,…