对人类活动进行分类
人类行为理解的一个重要方面是对日常活动的识别和监控。一个可穿戴的活动识别 系统可以提高许多关键领域的生活质量,如动态监测、家庭康复和跌倒检测。基于 惯性传感器的活动识别系统用于监测和观察老年人远程个人报警系统[1],检测和 分类瀑布[2],医疗诊断和治疗[3],监控儿童远程在家里或在学校,康复和物理治 疗,生物力学研究、人体工程学、体育科学、芭蕾和舞蹈、动画、电影制作、电视 、现场娱乐、虚拟现实和电脑游戏[4]。我们尝试使用定位于人体不同部位的微型 惯性传感器和磁力计来对人类活动进行分类,从而获得了以下数据。 每项19项活动分别由8名受试者(4名女性,4名男性,年龄在20-30岁之间)进 行,持续5分钟。每个受试者每次活动的总信号持续时间为5分钟。受试者被要求以 自己的风格进行活动,而不受如何进行活动的限制。因此,一些活动的速度和振幅 存在着学科间的变化。 传感器单元被校准,以获取25 Hz采样频率的数据。5分钟的信号被分成5秒的片 段,以便为每个活动获得480个(=60×8)的信号片段。 这19项活动包括: 1.坐(A1); 2.站(A2); 3.躺在背上(A3) 4.右侧侧卧(A4); 5.上升楼梯(A5); 2 6.下楼梯(A6); 7.站在电梯里(A7); 8.在电梯中四处移动(A8); 9.在停车场内行走(A9); 1 0 . 在跑步机上平速4 km/h,倾斜15度(A10); 11.在跑步机上以4 km/h的速度行走,倾斜15度(A11); 12.在跑步机上跑步,速度为8 km/h(A12); 13.练习使用一个步进器(A13); 14.使用交叉训练器进行练习(A14); 15.在水平位置骑运动自行车(A15); 16.以垂直位置骑运动自行车(A16); 17.划船(A17); 18.跳跃(A18); 19.打篮球(A19)。 您的团队被要求开发一个合理的数学模型来解决以下问题。
1.请设计一套特征和一个有效的算法,以便从这些磨损传感器的数据中分类19 种类型的人体行为。
2.由于数据的高成本,我们需要使模型在有限的数据集下具有良好的泛化能力 。我们需要具体地研究和评估这个问题。请设计一种可行的方法来评估您的模型的泛化能力。
3 . 请研究并克服过拟合问题,使您的分类算法能够广泛应用于人的动作分类问题.
赛题分析
C题在A、B、C、D中属于难度较小的,难点在于对数据的处理和方法的使用,官方所给的数据集有限,可能会出现模型精度低、泛化能力差等问题,这也是题目中所提到的,这就是C题建模的重点。
第一题
需要设计一套特征和一个有效的算法,以便从这些磨损传感器的数据中分类19 种类型的人体行为。
特征提取的方法有很多,包括时域特征方法、频域特征方法、时频域特征提取方法和基于深度学习的方法。
时域特征提取方法可以提取信号序列的幅值、能量、相关系数等特征然后输入到分类器(支持向量机、极限学习机、随机森林)中进行分类
频域特征提取方法可以提取信号序列的特征频带然后输入到分类器(支持向量机、极限学习机、随机森林)中进行分类
深度学习方法利用卷积自动提取序列的特征进行分类
这里给大家推荐时域特征提取方法和深度学习的方法,大家可以参考一下代码:
决策树与随机森林在分类预测中的应用
基于粒子群优化深度置信网络的分类预测
关注下方公众号,输入对应名称获取代码,例如:基于粒子群优化深度置信网络的分类预测
第二题
由于数据的高成本,我们需要使模型在有限的数据集下具有良好的泛化能力 。我们需要具体地研究和评估这个问题。请设计一种可行的方法来评估您的模型的泛化能力。
官方发给出的数据集有限,可以考虑数据增强技术,或者查找对应数据扩充数据集、交叉验证、模型集成等方法来提高模型的泛化能力,泛化能力的评估可以采用准确度、精确率、召回率、F1值、ROC、AUC等指标进行评估。
这里给大家推荐GAN来进行数据增强,以此来扩充样本数据集
第三题
3 . 请研究并克服过拟合问题,使您的分类算法能够广泛应用于人的动作分类问题.
过拟合问题可以采用数据正则化、Dropout和提早停止等方法。然后使用偏差-方差分解来使用方法前后分析模型的拟合程度。