数学建模-基于机器学习的家政行业整体素质提升因素分析

news2024/11/24 3:01:18

基于机器学习的家政行业整体素质提升因素分析

整体求解过程概述(摘要)

  家政服务业即为家庭提供多种类服务的专门行业,在第三产业中占有重要地位。但近年来,由于人工智能家居产业的发展与客户对家政从业者的要求水平不断提高,家政行业仍面对较大问题。
  本文从家政从业人员的角度出发,首先,通过网络爬虫爬取家政从业者相关数据,并对数据进行量化处理后展开分析。其次,对家政从业者的工作经历和培训评价进行词频分析和词云图制作,以此来预判客户需求的倾向性。接着进行因子分析,得到家政从业者的综合评分公式,以此对家政从业者进行综合评估。而后,为进一步研究家政从业者的专业水平与核心素养对其制定预期工资的影响,在因子分析的基础上,使用回归模型进行验证,发现模型拟合度较好,说明家政从业者专业水平与其工资联系密切。在模型构建方面,我们建立了 BP 神经网络,并采用 Levenberg-Marquardt 算法仿真,得出准确率为 90.0%的模型;同时,在使用模型筛选器将机器模型筛选出最适用的袋装树模型后,
  通过对训练集进行训练、优化剪枝最终得到较为简洁且采样误差与交叉验证误差分别为 0.1334 和 0.1735 的决策树模型,以此判断家政从业者的个人特质是否能使其个人工资超过行业平均工资。最后通过代入训练和袋外数据测试构建出准确性约为 90.5%的随机森林模型,分析影响家政从业者预期工资的因素。通过模型正确率分析得出,随机森林模型预测准确性较高。
  通过分析得出结论,一方面,家政从业者想使得预期工资达到平均工资水平,须提升个人专业水平,参与正规专业培训,丰富个人专业技能,提升市场竞争力;另一方面,由于家政行业规模扩大,行业要求更加严格,行业秩序更加规范,家政行业整体素质有较大提升。

问题分析

  对于家政服务从业人员的研究,本文进行了线上搜集数据,内容涉及基本信息、就业情况、培训状况、求职意向、工作经历、客户评价六大方面;对于家政服务需求人员进行线上调研,内容涉及家政服务人员满意度评价、问题及建议两方面内容;对于家政服务中介机构进行线上调研,内容涉及基本信息、雇佣状况、服务需求、培训方法、对策前景等五个方面。本次研究具体内容涵盖工作 id、实名信息、求职意向、是否住家、期望工资、年龄、学历、生肖、婚姻、籍贯、身高、体重、经验、状态、做饭口味、会说语言、工作范围、特殊技能、拥有证书、培训记录、工作记录,老师评价等。

模型的建立与求解

  本文选用 Python 软件以网络爬虫方式来进行数据收集,以家政港作为平台爬取文本信息,了解家政从业人员基本信息、个人状况、客户评价等。在数据收集后,运用 Excel 进行数据量化处理,随后运用 Python 软件进行词频分析和词云图程序编写;运用 Stata 进行因子分析与回归分析;运用 Matlab2018b 软件对 BP 神经网络模型的数据进行归一化处理与仿真模拟;运用 DevC++与 Matlab共同编程实现有关随机森林模型的模型分类筛选、决策树和随机森林主函数的编写以及随机森林程序的运行;运用 Mathtype 进行相关数学公式的编写;运用Photoshop、Tableau、Visio2013 分别进行词云图图片处理、地图和因子分析树状图以及流程图神经网络图的绘制,以此来进行统计推断的估计、统计分组确定、综合指标的测算、统计模型的衡量等。

模型的建立与求解整体论文缩略图

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可

(代码和文档not free)

x=[5119.276,6688.352,6842.004,7196.007,8360.984,8255.013,12839.98,14399.89,14502.29,16537.52];

lag=1;
% 自回归阶数
iinput=x;
% x为原始序列(行向量)
n=length(iinput);
%准备输入和输出数据
inputs=zeros(lag,n-lag);
for i=1:n-lag
inputs(:,i)=iinput(i:i+lag-1);
end
targets=x(lag+1:end);
%创建网络
hiddenLayerSize = 10;
%隐藏层神经元个数
net = fitnet(hiddenLayerSize);
% 避免过拟合,划分训练,测试和验证数据的比例
net.divideParam.trainRatio = 50/100;
net.divideParam.valRatio = 25/100;
net.divideParam.testRatio = 25/100;
%训练网络
[net,tr] = train(net,inputs,targets);
net.trainParam.show=1000; %每1000轮回显示一次结果
net.trainParam.Lr=0.05; %学习速率为0.05
net.trainParam.epochs=3000; %循环10000次
net.trainParam.goal=0.0000000001; %均方误差
%% 根据图表判断拟合好坏
%yn=net(inputs);
% errors=targets-yn;
%figure, ploterrcorr(errors)
%绘制误差的自相关情况(20lags)
% figure, parcorr(errors)
%绘制偏相关情况
% [h,pValue,stat,cValue]= lbqtest(errors)
%Ljung-Box Q检验(20lags) figure,plotresponse(con2seq(targets),con2seq(yn))
%看预测的趋势与原趋势% figure, ploterrhist(errors)
%误差直方图% figure, plotperform(tr)
%误差下降线%% 下面预测往后预测几个时间段
fn=3;
%预测步数为fn。

f_in=iinput(n-lag+1:end);f_out=zeros(1,fn);
%预测输出% 多步预测时,用下面的循环将网络输出重新输入
for i=1:fn f_out(i)=net(f_in);
f_in=[f_in(2:end);f_out(i)];
end
% 画出预测图
figure,plot(2007:2016,iinput,’b’,2016:2019,[iinput(end),f_out],’r’)
全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1288228.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【TiDB理论知识04】TiKV-分布式事务与MVCC

分布式事务 下面一个事务 里面有两个更新,分别将id1的Tom改为Jack,将id2的zhangsan 改为 lisi。在MySQL中这个事务很普通,但是在分布式数据库TiDB 中的会遇到什么问题呢? begin; (1,Tom) --> (1,Jack) (2,zhangsan) --> (2,lisi) commit; 比如(…

[头歌系统数据库实验] 实验3 MySQL的DDL语言

目录 第1关:将P表中的所有红色零件的重量增加6 第2关:把P表中全部红色零件的颜色改成蓝色 第3关:将SPJ表中由S5供给J4的零件P6改为由S3供应 第4关:将SPJ表中所有天津供应商的QTY属性值减少11(用子查询方式&#x…

创业和打工该如何选择

创业和打工应该根据自己的人生目标和经济条件来具体选择,创业和打工是两条不同路,各有优劣不能一概而论。 上班打工的好处是相对稳定和安全。你有固定的工作时间和薪水,不需要承担太多的风险和责任。 而做生意创业有更大的收入潜力。如果你的…

球机实现飞机追踪

目录 1. 背景2. 实现步骤2.1 飞机识别2.2 计算目标与球机中心的偏离角度2.2.1 获取球机视场角2.2.2 计算偏离角度 2.3 计算角速度2.4 将角速度映射到球机转速挡位 1. 背景 球机本身带有一些跟踪算法,比如:人员跟踪、车辆跟踪,比较有限。如果…

linux无法打开M4a格式音频的解决方法

linux是开源系统,之所以打不开,是因为部分linux系统为了避免版权问题,没有m4a的解码插件。所以,解决的办法是安装如下两个非常小的转换器,我们一般用不到转换器的功能,而是反向应用,通过两个几十…

TinyMPC - CMU (卡耐基梅隆大学)开源的机器人 MPC 控制器

系列文章目录 CasADi - 最优控制开源 Python/MATLAB 库 文章目录 系列文章目录前言一、机器人硬件对比1.1 Teensy 上的微控制器基准测试1.2 机器人硬件1.3 BibTeX 二、求解器三、功能(预期)3.1 高效3.2 鲁棒3.3 可嵌入式3.4 最小依赖性3.5 高效热启动3.…

第四代可燃气体监测仪监测场景有哪些?

随着城市化进程的加速,燃气作为一种重要的能源在每个城市都得到了广泛的应用。然而燃气泄漏所引发的安全问题也日益增加,为了保障燃气安全并防止泄漏事故的发生,可燃气体监测仪在其中发挥着重要的作用。可燃气体监测仪适用于甲烷气体浓度监测…

从零开始训练一个ChatGPT大模型(低资源,1B3)

macrogpt-prertrain 大模型全量预训练(1b3), 多卡deepspeed/单卡adafactor 源码地址:https://github.com/yongzhuo/MacroGPT-Pretrain.git 踩坑 1. 数据类型fp16不太行, 很容易就Nan了, 最好是fp32, tf32, 2. 单卡如果显存不够, 可以用优化器adafactor, 3. 如果…

基于Java SSM框架实现网络视频播放器管理系统项目【项目源码+论文说明】计算机毕业设计

基于java的SSM框架实现网络视频播放器管理系统演示 摘要 21世纪的今天,随着社会的不断发展与进步,人们对于信息科学化的认识,已由低层次向高层次发展,由原来的感性认识向理性认识提高,管理工作的重要性已逐渐被人们所…

【泛微ecology】将多个字段的数据合并到一个字段

doFieldSQL("select concat(concat(sqr,,),sy) as c from formtable_main_2 where requestid $requestid$ ")

CC++内存管理方式

文章目录 1. C/C内存分布总结 C语言中动态内存管理C内存管理方式new/delete操作内置类型new和delete操作自定义类型c推荐是用new和deleteoperator new与operator delete函数 定位new 1. C/C内存分布 我们先来看下面的一段代码和相关问题 int globalVar 1; static int static…

UE4/UE5 材质实现带框环形进度条

UE4/UE5 材质实现带框环形进度条 此处使用版本:UE4.27 原理:大圆减小圆可以得到圆环,大圆环减小圆环,可以得到圆环外围线框 实现效果: 实现(为了给大家放进一张面前能看的图,我费劲了心思&…

使用 GPTs 手捏一个代码评分器(两小时速成)

嗨!大家好久不见~ ChatGPT 支持 GPTs 也有段时间了,看着应用商店里大神们捏出来的 GPTs , 有些确实很有意思,比如:AI 杠精、模拟面试官、海龟汤… 团子也跃跃欲试,想捏一个 好玩且对大家有用 的 GPTs 出来。 考虑到关注…

如何科学制定营销战略规划?公开课(一)销售罗盘销冠100栏目

上周,销售罗盘&销冠100栏目,重磅推出2场公开课。点击链接查看回放:《如何科学制定营销战略规划?》《如何搭建客户经营体系?》 在第一期公开课《如何科学制定营销战略规划?》中,销售罗盘创始…

Leetcode刷题详解——单词拆分

1. 题目链接:139. 单词拆分 2. 题目描述: 给你一个字符串 s 和一个字符串列表 wordDict 作为字典。请你判断是否可以利用字典中出现的单词拼接出 s 。 **注意:**不要求字典中出现的单词全部都使用,并且字典中的单词可以重复使用。…

TypeScript枚举类型详情、类型断言

一. 概念 TypeScript中的枚举是一种数据类型,它是一组具有预定义名称的有限值的集合。枚举类型可以使代码更加可读、可维护和易于理解。 类似对象,枚举是将一组无序但极度相关数组集合在一起声明存储。 二. 枚举特性 1. 内部进行了双向赋值 enum Numb…

Socket和Http通信原理

Socket是对TCP/IP协议的封装,Socket本身并不是协议,而是一个调用接口(API),通过Socket,我们才能使用TCP/IP协议,主要利用三元组【ip地址,协议,端口】。 Http协议即超文本传输协议&a…

VIVADO-FFT IP核学习记录

根据用户手册使用IP核 ① 找到user guide / product guide 并打开 ② 找到Customizing and Generating the Core(不同手册可能题目不一样),查看IP核的创建过程中各个参数的意义和设置方法。 ③ 找到port description ,查看接口注释 根据网络教程使用…

WPS Office JS宏实现批量处理Word中的标题和正文的样式

该篇讲解下word文档中的标题和正文批量修改样式,如下图: 前面一篇已讲解了WPS Office宏编辑器操作方法,这里不细讲了,如有不清楚可以查看该篇:https://blog.csdn.net/jiciqiang/article/details/134653657?spm1001.20…

创建腾讯云存储桶---上传图片--使用cos-sdk完成上传

创建腾讯云存储桶—上传图片 注册腾讯云账号https://cloud.tencent.com/login 登录成功,选择右边的控制台 点击云产品,选择对象存储 创建存储桶 填写名称,选择公有读,私有写一直下一步,到创建 选择安全管理&#…