r、 weka从决策树模型看员工为什么离职?

news2025/1/18 7:41:25

马云说:“员工离职的原因总是只有两个:钱,没有到位;心委屈了。”

现在很多老板都抱怨说,年轻人的流动率太高了,员工觉得老板的钱太少了,最后还是多指责。

最近我们被客户要求撰写关于员工离职的研究报告,包括一些图形和统计输出。

 视频:从决策树到随机森林:R语言信用卡违约分析信贷数据实例

从决策树到随机森林:R语言信用卡违约分析信贷数据实例

,时长10:11

为什么我们最好和最有经验的员工过早离职?

到底如何解决这个困境? 拓端数据tecdat使用数据分析员工离开的原因,希望能从中找到线索。

我们搜集的数据包含:

l能力评估

l项目数量

l平均每月工作时间/小时

l花在公司的时间

l是否有工作意外

l是否在过去5年里进行了推广

l部门

l薪水

l员工是否离开

【大数据部落】从决策树模型看员工为什么离职?

1 判断哪些员工做出了较大贡献

为了判断哪些员工做出了较大贡献,我们需要得到一个判断的规则.

因此在这里我们将使用evaluation来代表哪些员工作出贡献的衡量标准,

为了得到判断的规则,我们要使用决策树模型.

决策树模型的概念如下:

决策树(decision tree)是一个树结构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。

然后我们需要evaluation作为决策树的因变量,将其他的员工特征作为输入变量,然后我们可以得到决策树的规则,从而判断哪些变量可以判断员工作出了贡献

我们查看模型的结构

从上面的结果来看,我们可以看到树的节点有平均工作时间,在公司所花的时间,满意程度,这几个变量.因此我们可以通过这些变量来判断一个人供是否对公司做出了贡献.从第一个节点我们可以看到,如果每月的平均工作小时小于零一百六十个小时的话,那么他的贡献,在78%左右,也就是平均贡献非常低.如果工作时间大于160个小时,我们要看他在公司所花的时间.如果公司所花的时间大于3.5.那么他对公司做出的贡献在81%左右.如果在公司所花的时间不足3.5.那么我们就要判断他对公司的满意程度.因此从上面的结果中我们可以看到,在公司所花的时间越多,那么这个人对公司的贡献可能略大,公司的满意程度较低,,说明他认为公司的可提高空间还很大,因此他对公司的贡献也会较大.

2 哪些原因会导致员工离职

然后我们是用同样的方法来判断哪些原因会导致员工的离职,在这里我们使用员工是否离职作为因变量.

我们查看模型的结果

从结果中,我们可以看到有一些变量重复的出现,比如对公司的满意程度,在公司所花的时间所做的工程数量,最后的评估结果.因此可以认为这些变量对员工是否离职产生了重要的影响.

同时我们还可以得到对员工是否离职的影响的一个决策树方程

从上面的结果来看,我们可以发现,系数如果是负的那么说明这个,这个变量对于是否离职有负相关的作用,如果系数是正的,那么这个变量对员工是否与此产生了正相关的作用.那么从上面的结果中我们就可以看到,如果一个员工对公司的满意程度越高,那么他离职的可能性就越小,如果一个员工最后的评估成绩越高,那么他离职的可能性也越小,如果他做过的项目数量越多,那么他离职的可能性也越小,同时我们可以看到,如果他的薪水较低,那么他离职的可能性就越大.同时我们还可以看到,一个人的岗位,还有他平均的工作时间,对她是否离职似乎没有影响.

3 能否通过加薪升职等方式挽留那些做出贡献的员工 ?

那么是否可以通过升职加薪的方式挽留作出贡献的员工呢?

从上面的方程来看,答案是肯定的.

因为一个人的薪水越低,那么他离职的可能性就越高,因此如果增加一个人的薪水,那么会降低他的离职概率.同时从系数的大小我们还可以判断,如果一个人的职位是i t部门那么他的离职可能性会较小。同时我们可以看到,如果公司对它的最后评估越高,那么他离职的可能性也越小,因此我们可以通过升职加薪的方式来挽留作出贡献的员工。

提高教育水平,使年轻人具有中产阶级价值观和更高的自我期望。 但高等教育的普及也导致了中产阶级价值实行变得困难。 这就像能买得起票的人变得更多,结果不是每个人都可以上车。 因此,有时我们要调整对工作的预期,做好眼前的事情。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/44539.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

黄佳《零基础学机器学习》chap2笔记

黄佳 《零基础学机器学习》 chap2笔记 第2课 数学和Python基础知识 文章目录黄佳 《零基础学机器学习》 chap2笔记第2课 数学和Python基础知识2.1 函数描述了事物间的关系机器学习中常用的一些函数2.2 捕捉函数的变化趋势2.3 梯度下降2.4 机器学习的数据结构--张量2.4.1 张量的…

Mysql5.7 基于Docker搭建主从复制集群

基础 参考:mysql5.7-Docker-安装-备份 拉取镜像 docker pull mysql:5.7 创建目录 mkdir /home/liangshijie/mysql-docker-file/conf mkdir /home/liangshijie/mysql-docker-file/logs mkdir /home/liangshijie/mysql-docker-file/data创建配置文件 cd /home…

GEE Python本地快速下载GEE数据(比网页版保存到网盘再下载快几十倍,尤其是在下载几十年的长时间系列数据时,速度提升更加明显)

前言 可根据研究区直接裁剪数据以及进行一些计算处理后再下载,GEE成为了大家下载数据的重要途径,然而直接通过官网网页将数据先保存到网盘再下载的下载方法速度太慢,新号速度还好,越用速度越来越慢,本文提供了一种直接…

IBM MQ通道接收端绑定步骤

不同类型的绑定 IBM MQ 支持应用程序可以连接的两种方式: 1.本地绑定:这是当应用程序和队列管理器在同一个操作映像上时。 CHLAUTH 与此类应用程序连接无关。 2. 客户端绑定:这是应用程序和队列管理器使用网络进行通信的时候。 应用程序和队列…

从Opencv之图像直方图源码,探讨高性能计算设计思想

前言 纸上得来终觉浅,绝知此事要躬行。学会算法的理论很重要,但是把理论高效的实现也是需要一点点练习的。 图像直方图的理论很简单,就是把一个图像的像素区间划分为几个子区间,然后统计图像中的像素包含在子区间内的个数。这里&a…

什么是网络变压器,它是干什么用的?作用/参数表/价格及型号体系有哪些?怎么测量网络变压器好坏

什么是网络变压器? 网络变压器是在以太网网络传输设备中,主板上芯片PHY与网口RJ45之间的一个黑黑的小方块,里面的结构是磁环及铜线组成,这个小方块就是我们俗称的网络变压器 有的变压器中心抽头接到地。而接电源时,电…

深度学习入门(五十七)循环神经网络——循环神经网络从零开始实现

深度学习入门(五十七)循环神经网络——循环神经网络从零开始实现前言循环神经网络——循环神经网络从零开始实现教材1 独热编码(one-hot)2 初始化模型参数3 循环神经网络模型4 预测5 梯度裁剪6 训练7 小结前言 核心内容来自博客链接1博客连接2希望大家多…

【Hack The Box】linux练习-- Pandora

HTB 学习笔记 【Hack The Box】linux练习-- Pandora 🔥系列专栏:Hack The Box 🎉欢迎关注🔎点赞👍收藏⭐️留言📝 📆首发时间:🌴2022年11月27日🌴 &#x1f…

TensorFlow之文本分类算法-4

1 前言 2 收集数据 3 探索数据 4 选择模型 5 准备数据 6 模型-构建训练评估 机器学习主要包括模型构建、模型训练、模型评估,在选择模型章节中已经对如何根据S/W的比率进行模型的选择,其包括n-gram模型或者序列模型,本章节内容主要描述…

LeetCode-813-最大平均值和的分组

1、动态规划法 我们可以利用数组dp[i][j]dp[i][j]dp[i][j]来表示我们将数组中区间[0,i−1][0,i-1][0,i−1]的元素分为jjj组的平均值的总和。因此我们可以得到状态转化方程如下:{dp[i][j]∑r0i−1nums[r]i,j1dp[i][j]maxx≥j−1(dp[x][j−1]∑rxi−1nums[r]i−x),j&…

计算机五大部件是指什么

计算机五大部件: 计算机硬件系统由运算器、控制器、存储器(内外存储器)、输入设备和输出设备五部分组成。 1、控制器:控制器就是一个系统中枢,控制计算机如何运行、运转的基本单元。 每一个运算器都需一个单独的控制…

D-016 JTAG硬件电路设计

JTAG硬件电路设计1 简介1.1 JTAG分类1.2 ARM调试器2 设计要点3 电路实战3.1 Xilinx3.2 ALTERA ------USB blaster1 简介 JTAG(Join Test Action Group)的中文名称为联合测试工作组,是一种国际标准测试协议,主要用于芯片内部测试:验证设计和P…

Ubuntu16.04 完整版 Gym 安装及说明

Ubuntu16.04 完整版 Gym 安装及说明1. 安装前言2. Gym 开发环境说明3. 完整版 Gym 的安装3.1 Anaconda 创建虚拟环境3.2 安装 gym[box2d]3.2.1 采用官方 GitHub 教程进行安装的报错及解决方案3.2.2 采用 Anaconda 进行安装3.2.3 测试能否成功运行 LunarLander-v2 环境3.3 安装 …

【一文秒懂——YAML配置文件】

目录 1. YAML配置文件 2. 实例 2.1 将原application.properties改为application.yml: 2.2 将原application-dev.properties改为application-dev.yml: 1. YAML配置文件 在Spring Boot项目中,还可以使用YAML配置文件,这是一种使…

一文搞懂漏洞严重程度分析

漏洞的级别定义主要从两个维度进行判断; 1、可利用性 2、影响性 可利用性指标 可利用性指标组刻画脆弱性组件(即包含漏洞的事物)的特征,反映漏洞利用的难易程度和技术要求等。可利用性指标组包含四个指标,分别是攻击…

最新阿里云GPU服务器租用配置费用价格表出炉(多配置报价)

阿里云GPU服务器优惠3折GPU云服务器vgn6i优惠价469.46元/月起,GPU云服务器gn6i和GPU云服务器gn6v均有活动,NVIDIA T4及V100均有活动,主机教程网 来详细说下阿里云GPU云服务器收费标准价格表,再来说说GPU云服务器计费模式&#xff…

Python学习笔记(十八)——Pandas进阶

文章主要内容文件操作: • 文件读取: read_csv(csv),read_table(表格),read_excl(excel) • 文件写入:to_csv, to_excel 数据清洗: • 处理缺失值:isnull(识别), dropna (过滤), fillna(填充) • 数据转换:drop_duplic…

MVCC多版本并发控制

目录 1、数据库并发场景 2、当前读和快照读 3、MVCC的隔离级别 4、实现原理 4.1、隐藏字段 ​​​​​​​4.2、Undo_log(版本链) 4.3、Read View(读视图) 4.4、RC、RR隔离级别下的快照读有什么区别 MVCC,多版…

文献认证!Kamiya艾美捷抗酒石酸酸性磷酸酶TRAP染色试剂盒

人类及动物体骨组织不断地进行着重建,骨重建过程包括骨的分解吸收与新骨的形成。破骨细胞(Osteoclast,OC)负责骨分解与吸收,而成骨细胞(osteoblast,OB)负责新骨形成。破骨细胞贴附在…

【WAX链游】发布一个免费开源的MiningNetwork合约脚本BTK

前言 挖矿网络(Mining Network)官网: https://miningnetwork.io 挖矿网络(Mining Network)合约脚本:https://github.com/encoderlee/MiningNetworkBot 回顾之前我们推出过的免费开源链游脚本&#xff1a…