R语言贝叶斯广义线性混合(多层次/水平/嵌套)模型GLMM、逻辑回归分析教育留级影响因素数据...

news2024/12/23 23:14:24

全文下载链接:http://tecdat.cn/?p=24203

本教程使用R介绍了具有非信息先验的贝叶斯 GLM(广义线性模型) 点击文末“阅读原文”获取完整代码数据

当前教程特别关注贝叶斯逻辑回归在二元结果和计数/比例结果场景中的使用,以及模型评估的相应方法。使用教育数据示例。 此外,本教程简要演示了贝叶斯 GLM 模型的多层次扩展。

相关视频

=

本教程遵循以下结构:
1.准备工作;
2.GLM介绍;
3.教育数据;
4.数据准备;
5.贝叶斯逻辑回归;
6.贝叶斯二项Logistic回归;
7.贝叶斯层次逻辑回归。

准备

本教程需要:
– 假设检验和统计推断的基础知识;
– 贝叶斯统计推断的基础知识;
– R 编码的基础知识;
– 使用 tidyverse 进行绘图和数据操作的基本知识。

广义线性模型 (GLM) 介绍

广义线性模型,是为了克服线性回归模型的缺点出现的,是线性回归模型的推广。首先自变量可以是离散的,也可以是连续的。离散的可以是0-1变量,也可以是多种取值的变量。广义线性模型取消了对残差(因变量)服从正态分布的要求。残差不一定要服从正态分布,可以服从二项、泊松、负二项、正态、伽马、逆高斯等分布,这些分布被统称为指数分布族。

教育数据

本教程中使用的数据是教育数据。

这些数据来自于全国性的小学教育调查。数据中的每一行都是指一个学生。结果变量REPEAT是一个二分变量,表示一个学生在小学教育期间是否留过级。SCHOOLID变量表示一个学生所在的学校。个人层面的预测因素包括。性别(0=女性,1=男性)和PPED(受过学前教育,0=没有,1=有)。学校层面的是MSESC,代表学校平均SES(社会经济地位)得分。

本教程试图使用教育数据回答的主要研究问题是:

  • 忽略数据的层次结构,性别和学前教育对学生是否留级有什么影响?

  • 忽略数据的层次结构,学校平均SES对学生留级比例的影响是什么?

  • 考虑到数据的层次结构,性别、学前教育和学校平均社会经济地位对学生是否留级有什么影响?

这三个问题分别通过使用以下模型来回答:贝叶斯二元逻辑回归;贝叶斯二项式逻辑回归;贝叶斯多层次二元逻辑回归。

数据准备

加载必要的包

library(tidyverse) #用于数据处理和绘图
library(sjstats) #用于计算类内相关(ICC)。
library(ROCR) #用于计算曲线下面积(AUC)的统计数据
library(modelr) #用于数据处理

导入数据

93701e9622cb9d929abbe8d96b6360c8.png

数据处理

Ed\_e <- Ed\_Ra %>%
  mtae(SCHLI = fcor(SCLID,
         SEX = if_se(SX == 0, "grl", "by"),
         SEX = facor(SEX, lvls = c("gil", "boy")),
         PED = if_ese(PPED == 0, "no", "yes"),
         PED = facr(PPD, leel = c("no", "yes")))

c8a10af8f12d9a92281f29cfc2ff61a7.png

检查缺失数据

New %>%
  summar(lst(~sm(is.na(.)))) %>%
  gaer()

4a6c652346186c2ecef06013f2a95277.png

该数据缺少 1066 个MSESC 变量的观测 值。缺失数据的处理本身就是一个复杂的话题。为方便起见,我们在本教程中简单地按列删除缺少数据的案例。

New <- New %>%
  fltr(!is.na(MEC))

贝叶斯二元逻辑回归(具有非信息先验)

探索数据: REPEAT 与 SEX 和 PPED

gru_y(SEX) %>%
  suma(RPEAT = sm(REEAT))

034d737a66e2d3c131b9cc5718778b31.png

group_by(PED) %>%
  sumais(RPEAT = sum(REEA))

cc0c86d2448145be52c084dbe36233bd.png

看来,留级的学生人数在男女之间有很大的不同,更多的男学生不得不留级。更多没有接受过学前教育的学生留级。这一观察结果表明,性别和学前教育可能对留级有预测作用。

拟合贝叶斯二元 Logistic 回归模型

执行贝叶斯 GLM。但是,请注意,在 family 参数中,我们需要为二元逻辑回归指定 bernoulli (而不是 binomial)。还有一些额外的参数: warmup 指定预烧期(即应该丢弃的迭代次数); iter 指定总迭代次数; chains 指定链数; inits 指定迭代的起始值(通常你可以使用参数的最大似然估计作为起始值,或者简单地要求算法从零开始); cores 指定用于算法的核心数; seed 指定随机种子,允许复制结果。

请参阅下面的具有两个预测变量的二元逻辑回归模型的规范,不使用信息先验。

Baysoel(fr= RPEAT ~ SX + PED,  
                   famly = benouli(link = "logit"),
                  )

1cebd7c4a2dc34f99fd8a473437744c8.png

模型收敛

在查看模型摘要之前,我们应该检查是否存在两条链不收敛的依据。

首先,我们为每个感兴趣的参数绘制毛毛虫图。

plot(BysMenr, 
         tpe = "trce")

8aa753d24a6a69a4fe4f8999607e68f2.png

1d924a8e1be43f641da6b1116e30fed7.jpeg

该图仅显示预烧期后的迭代。两条链对所有参数都很好地混合,因此,我们得出收敛的依据。


点击标题查阅往期内容

4c2a93a9267d4d6c0f4c57d43a179cca.jpeg

R语言JAGS贝叶斯回归模型分析博士生延期毕业完成论文时间

outside_default.png

左右滑动查看更多

outside_default.png

01

236de1a9b9f93a3c947352698d620217.png

02

82f8c087adfdd3439aa475dac1aebe9b.png

03

0701896efa9f8dd1823adb686056ddf2.png

04

80c27a5b15a417b723dc0053e9345806.png

我们还可以检查自相关,考虑到强自相关的存在会使方差估计产生偏差。

plot(Byory ,
         tye = "afbar")

c6f9d9a6f22ddcacd5974a5d0fe27919.jpeg

该图没有显示两个链中所有模型变量的自相关证据,因为自相关参数都迅速减小到零附近。

解释

现在,我们可以进行模型的解释。下面是贝叶斯二元逻辑回归模型的模型摘要。

smma(Bayoenry)

a5a0b8dc7d7b42dcdc52dec7f9f9d1a9.png

为了比较,下面是频率论二元逻辑回归模型的模型摘要。

glm(fma= REEA ~ SX + PPD,
                    famly = bnmia(link = "logit"),
                    daa = Ne)

d84f6bbc92d6964c32de47dd4fea5575.png

从上面的模型总结中,我们可以看到贝叶斯模型的估计与频率论模型的估计几乎相同。这些估计的解释在频率论和贝叶斯模型中是相同的。然而,请注意,不确定性区间的解释在两个模型之间是不同的。在频率论模型中,使用 95% 的不确定性区间(置信区间)背后的想法是,在重复抽样的情况下,95% 的结果不确定性区间将覆盖真实的总体值。这让我们可以说,对于给定的 95% 置信区间,我们有 95% 的置信区间包含真实的总体值。然而,它不允许我们说置信区间有 95% 的机会包含真实的总体值(即 频率论不确定性区间不是概率陈述)。相比之下,在贝叶斯模型中,95% 的不确定性区间(称为可信区间)更具可解释性,表明真实总体值有 95% 的机会落入该区间内。当 95% 可信区间不包含零时,我们得出结论,相应的模型参数可能有意义。

让我们使用可视化点估计及其相关的不确定性区间 。

plot(asMdeBinr, 
         tye = "aeas",
         prb = 0.95)

6ead7eb58412322f6345f99f99fd6b02.png

上图显示了参数估计的密度。每个密度中的深蓝色线表示点估计,而浅蓝色区域表示 95% 的可信区间。我们可以很容易地看到, SEX 和 PPED 都是有意义的预测变量,因为它们的置信区间不包含零,并且它们的密度具有非常窄的形状。 SEX 正面预测学生留级的概率,而PPED 负面预测 。具体来说,与作为女孩相比,作为男孩更有可能留级,假设其他一切都保持不变。假设其他一切都保持不变,之前的教育不太可能导致留级。

为了解释参数估计的值,我们需要对估计取幂。见下文。

ex(fef(BeBiry)\[,-2\])

3da8990a38b55c7231f697b0e911557f.png

我们还可以绘制这些参数估计的密度。

plt(ay\_dl\_iay, 
         type ="areas",
         prb = 0.95,
         trnsoatos = "exp") +
  mne(xtp = 1, clo = gey")

e046385d3571ad6e99b3a7e2eb0dd3f8.png

请注意,参数估计的解释与几率而不是概率有关。几率的定义是。P(事件发生)/P(事件未发生)。在本分析中,假设其他一切保持不变,与女孩相比,男孩会增加54%的留级几率;与没有学前教育相比,假设其他一切保持不变,拥有学前教育会降低(1-0.54)%=46%的留级几率。留级的基线几率(由截距项表示),即如果你是一个没有受过学校教育的女孩,大约是17%。

参数效果的可视化

我们可以绘制模型中变量的边际效应(即重复评分的估计概率)。下面,我们展示了如何不同组合 SEX 和 PPED 不同的概率估计结果。这种方法的优点是概率比几率更容易解释。

Nw %>%
  dta_gd(SX PE) %>%
  d\_fddws(Baeo\_inry) %>%
plt(ae(x = .vau, y = inatn(SEX, PED))) +

d68c96cc4e7217649d94b4d3908ed9d8.jpeg

如我们所见,未受过学前教育的男生概率最高(~0.21),其次是未受过学前教育的女孩(~0.15),受过学前教育的男孩(~0.13),最后,是一个受过学前教育的女孩(~0.09)。请注意,估计值的 68%(较粗的内线)和 95%(较细的外线)置信区间都包括在内,以使我们对估计值的不确定性有所了解。

模型评估

我们了解到我们可以使用似然比检验和 AIC 来评估模型的拟合优度。但是,这两种方法不适用于贝叶斯模型。相反,贝叶斯模型利用所谓的 后验预测 P 值 (PPP) 来评估模型的拟合度。此外,许多模型还使用 贝叶斯因子 来量化数据对模型的支持。

另外两个度量 是 正确分类率 和 _曲线下面积(AUC)_。它们与模型无关,也就是说,它们可以应用于频率论和贝叶斯模型。

正确分类率

正确分类的百分比是查看模型与数据拟合程度的有用度量。

#使用\`prdct()\`函数,从拟合的模型中计算出原始数据中学生的预测概率
Prd <- prdct(BadlBay, type = "espnse")
Ped <- ilse(Ped\[,1\] > 0.5, 1, 0)
CnuMx<- tale(Pre, pul(Nw,REPT)) #\`pull\`的结果是一个向量
#正确的分类率
sm(dag(Cosaix))/sum(Cofinaix)

39ad84a597c5d52af98b18a309052608.png

CMatix

b4e744ee8934e2de8ec5ae72b2c150a8.png

我们可以看到,该模型对所有观测值的85.8%进行了正确分类。然而,仔细观察混淆矩阵可以发现,模型预测所有的观察值都属于 "0 "类,也就是说,所有的学生都被预测为不会留级。考虑到REPEAT变量的多数类别是0(不),该模型在分类中的表现并不比简单地将所有观测值分配给多数类别0(不)更好。

AUC(曲线下面积)

使用正确分类率的替代方法是曲线下面积 (AUC) 度量。AUC 衡量歧视,即测试正确分类那些有和没有目标响应的能力。在当前数据中,目标响应是重复一个等级。我们从“留级”组中随机抽取一名学生,从“不留级”组中随机抽取一名学生。预测概率较高的学生应该是“重复成绩”组中的学生。AUC 是随机抽取的对的百分比,这是正确的。此过程将 AUC 与正确分类率区分开来,因为 AUC 不依赖于结果变量中类别比例的不平衡。值 0.50 表示模型的分类效果并不比机会好。

使用正确分类率的一个替代方法是曲线下面积(AUC)测量。AUC衡量的是分辨力,即测试对因变量进行正确分类的能力。在目前的数据中,目标因变量是留级。我们从 "留级 "组和 "不留级 "组中随机抽取一名学生。预测概率较高的学生应该是 "留级 "组中的学生。AUC是随机抽出的对子的百分比,这一点是真实的。这个程序将AUC与正确分类率区分开来,因为AUC不依赖于结果变量中类的比例的变化。0.50的值意味着该模型的分类效果不比随机好。一个好的模型的AUC分数应该远远高于0.50(最好是高于0.80)。

# 计算用该模型预测类别的AUC
Pr <- prdit(Bas\_odl\_iay type="rsone")
Pr <- rob\[,1\]
Prd <- prition(Prb, as.tor(ull(Ne, REPAT)))
auc <- pemneed, easre = "auc")
auc

fe8375a6a5e293c5341ea9d50c01e460.png

AUC 得分接近 0.60,模型不能很好地区分。

贝叶斯二项式逻辑回归(具有非信息先验)

逻辑回归也可用于对计数或比例数据进行建模。二元逻辑回归假设结果变量来自伯努利分布(这是二项分布的特例),其中试验次数 nn 为 1,因此结果变量只能是 1 或 0。相反,二项逻辑回归假设目标事件的数量服从 n 次试验和概率 q 的二项式分布。通过这种方式,二项逻辑回归允许结果变量采用任何非负整数值,因此能够处理计数数据。

聚集在学校内的个别学生的 信息。通过汇总按学校留级的学生人数,我们获得了一个新数据集,其中每一行代表一所学校,以及有关该学校留级学生比例的信息。该 MSESC (平均得分SES)也对学校的水平; 因此,它可用于预测特定学校留级学生的比例或数量。见下文。

转换数据

Prop <-New %>%
  gouby(SOLD,MSC) %>%
  suie(EAT = sum(RPT),
            TAL = n()) %>%
  urup()

717f2c40bb3fd27dae991b426a8ee2ae.png

在这个新的数据集中, REPEAT 指的是留级的学生人数; TOTAL 指特定学校的学生总数。

探索数据

Prop %>%
  plot(aes(x , y ) +
  point()

0665c7924ecacb0bd4f4071cf4778f63.png

我们可以看到,留级的学生比例与 的逆对数呈(中等)负相关 MSESC。请注意,我们将变量建模 MSESC 为其逆 logit,因为在二项式回归模型中,我们假设线性预测变量的逆 logit 与结果(即事件的比例)之间存在线性关系,而不是预测变量本身与预测变量之间的线性关系结果。

拟合二项 Logistic 回归模型

为了拟合贝叶斯二项逻辑回归模型,我们还使用了brm 与之前的贝叶斯二项逻辑回归模型一样的 函数。但是,有两个不同之处:首先,要在公式中指定结果变量,我们需要指定目标事件数 ( REPEAT) 和包含在 中的试验总数 ( TOTAL)  trials(),它们之间用 分隔 |。此外, family 应该是“二项式”而不是“伯努利”。

ay_Moe(REAT | rias(TTAL) ~ SEC,  
                        daa = Pop, 
                         inillnk "logt"))

a12099093177797e70915aa8e90fd4b5.png

summary

985a76ebe17700e974ac204ab0caec0b.png

频率模型(用于比较):

glm(fla =ind(PEAT, TAL-PET) ~ SS,
                  famiy = inal(lgit),
                  dta =Prop)

8dde43a995925d06a0f5891b0bda4a1c.png

我们可以看到贝叶斯和频率二项式逻辑回归模型之间的模型估计非常相似。请注意,为了使本教程更简短,我们跳过了检查模型收敛的步骤。您可以使用我们之前展示的相同代码(使用二元逻辑回归模型)来检查该模型的收敛性。

解释

二项式回归模型中的参数解释与二项逻辑回归模型中的参数解释相同。我们从上面的模型总结中知道,一所学校的平均 SES 分数与该学校学生留级的几率呈负相关。为了增强可解释性,我们再次计算 的指数系数估计 MSESC。由于 MSESC 是一个连续变量,我们可以对指数MSESC 估计进行标准化 (通过将原始估计与变量的 SD 相乘,然后对结果数字取幂)。

exp(fxef(Bodlrp)\[2,-2\]*sd(pll(_p,MSC), n.rm = T))

79245e1d324ac65916cbc447092f8bc8.png

我们可以看到,随着 的 SD 增加 MSESC,学生留级的几率降低了大约 (1 – 85%) = 15%。“Q2.5”和“Q97.5”分别指不确定区间的下限和上限。该置信区间不包含零,表明该变量可能有意义。

我们可以将 的效果可视化 MSESC

reraw(btrct, SSC) %>%
  grp(MSESC) %>%
  sume(ped_m = mean(ed,ar = R
            re_lw = qantle(ped,po = 0.025),
            rd_hgh = quatle(pd, prb = 0.975)) %>%
  plt(as(x = SC, y = pedm)) +
  line() +
  gmn(es(ymn = pe_ow,yma = redig), aha=.2) +

6f06e662078cbd1b54b3d9a501601ec5.jpeg

上图显示了MSESC 对学生留级概率的预期影响 。保持其他一切不变,随着 MSESC 增加,学生留级的概率降低(从 0.19 到 0.08)。灰色阴影区域表示每个 值处预测值的 95% 置信区间 MSESC

模型评估

与贝叶斯二元逻辑回归模型类似,我们可以使用PPPS和贝叶斯系数(本教程中没有讨论)来评估贝叶斯二元逻辑回归模型的拟合度。正确分类率和AUC在这里不适合,因为该模型不涉及分类。

贝叶斯多层次二元逻辑回归(具有非信息先验)

前面介绍的贝叶斯二元逻辑回归模型仅限于对学生层面的预测因素的影响进行建模;贝叶斯二元逻辑回归仅限于对学校层面的预测因素的影响进行建模。为了同时纳入学生层面和学校层面的预测因素,我们可以使用多层次模型,特别是贝叶斯的多层次二元逻辑回归。

除了上述动机之外,还有更多的理由来使用多层次模型。例如,由于数据是在学校内聚类的,来自同一学校的学生很可能比来自其他学校的学生更相似。正因为如此,在一所学校,一个学生留级的概率可能很高,而在另一所学校,则很低。此外,即使是结果(即留级)和预测变量(如性别、学前教育、SES)之间的关系,在不同的学校也可能不同。还要注意的是,MSESC变量中存在缺失值。使用多层次模型可以适当地解决这些问题。

以下图为例。该图显示了各个学校留级学生的比例。我们可以看到不同学校之间的巨大差异。因此,我们需要多层次模型。

Edu %>%
  grop_(ID) %>%
  sumrie(RP = sum(PA)/n()) %>%
  plt()

5c51e4a4f517add5b18ebccc29061a6b.png

我们还可以绘制SEX 和 REPEAT  ,SCHOOLID之间的关系 ,查看性别和留级之间的关系是否因学校而异。

Euew %>%
  utt(SX = ifelse(EX == "boy", 1, 0)) %>%
  plt(es(x = SE, y = REAT)) +
  pint(alpha = .1)+
  ooth(mehod = "glm", se = F, 
              hd.s= lsily = "binomial"))

3cc82702ae91d3aca53ffa8b62a4a8e5.png

在上面的图中,不同的颜色代表不同的学校。我们可以看到,不同学校的SEX和REPEAT之间的关系似乎有很大不同。

我们可以为PPED 和 REPEAT绘制相同的图 。

due %>%
  tat(PED = ifelse(PED == "yes", 1, 0)) %>%
 pot(as(x = PP, y = RPT, cor =a.fcor(ID)) +
  goi(lha=.1, )+
  goth(method = "glm",
              ehog = lst(family = "binomial")) +

1c602ddfe0a6ac802a2c4fccc27f7b43.png

PPED 和 之间的关系 REPEAT 似乎也因学校而异。但是,我们也可以看到,大多数关系遵循下降趋势,从 0(未受过教育)到 1(受过教育),表明PPED 和 REPEAT之间存在负相关关系 。

由于上述观察,我们可以得出结论,需要在当前数据中进行多层次建模,不仅具有随机截距 ( SCHOOLID),而且还具有SEX 和 的 潜在随机斜率 PPED

中心变量

在拟合多层次模型之前,有必要使用适当的中心化方法(即大均值中心化或簇内中心化)对预测因子进行中心化,因为中心化方法对模型估计的解释很重要。根据Enders和Tofighi(2007)的建议,我们应该对第一层次的预测因子SEX和PPED使用组内中心化,对第二层次的预测因子MSESC使用平均值中心化。

Euee <- New %>%
  group_by(ID) %>%
  muae(SEX - mean(SE),
          PED - mean(PED)) %>%
 uou() %>%
  muate(  ME - mean(MEC, na.rm = T))

2fbfc81fc3d818e7a0942b4d5698ebee.png

仅截距模型

为了指定多层次模型,我们再次使用 包中的 brm 函数 brms。请注意,随机效应项应包含在括号中。此外,在括号内,随机斜率项和聚类项之间应以 隔开 |

我们首先指定一个仅截距模型,以评估数据聚类结构的影响。我们将跳过模型收敛诊断的步骤。

BaeselMti(RPAT ~ 1 + (1|SOLID),
                                   data  
                                   famly = beouli(link = "logt"

4bbd17f9353f12d282ecdd96050eb875.png

下面我们计算仅截距模型的 ICC(类内相关性)。请注意,对于非高斯贝叶斯模型(例如逻辑回归),我们需要设置“ppd = T”,以便方差计算基于后验预测分布。

icc(BylMunrept, pd = T)

b4897ad845755fac56d77a389dc5309b.png

0.29 的方差比(与 ICC 相当)意味着结果变量中 29% 的变异可以由数据的聚类结构来解释。这提供了证据,表明与非多层次模型相比,多层次模型可能会对模型估计产生影响。因此,多层次模型的使用是必要的。

完整模型

按部就班地建立多层次模型是一个好的做法。然而,由于本教程的重点不是多层次模型,我们直接从仅有的截距模型到我们最终感兴趣的完整模型。在完整模型中,我们不仅包括SEX、PPED和MSESC的固定效应项和一个随机截距项,还包括SEX和PPED的随机斜率项。请注意,我们指定family = bernoulli(link = "logit"),因为这个模型本质上是一个二元逻辑回归模型。

baysMoel(RPET ~ EX + PED + SESC + (1 + EX + PPD|ID),
                          data
                          famy = brnuli(lnk = "loit"))
summary(BaeMil)

488048282056deeb69cb478a05afb47a.png

我们可以绘制相关模型参数估计的密度。

plot(ByodlMtil,
         prb = 95)

198d2f14431de81d84169e09e0cc70d6.png

结果(与固定效应有关)与之前贝叶斯二元逻辑回归和二元逻辑回归模型的结果相似。在学生层面上,性别对学生留级的几率有正向影响,而PPED有负向影响。在学校层面上,MSESC对结果变量有负面的影响。在三个预测因子中,SEX和PPED的置信区间(由密度中的浅蓝色阴影区域表示)显然不包含零。因此,它们应该被视为有意义的预测因素。相反,MSESC尽管有95%的可信区间不含零,但可信区间的上界非常接近于零,其密度只包含零。正因为如此,MSESC可能是一个比SEX和PPED更不相关的预测因子。

现在让我们看看随机效应项 ( sd(Intercept)sd(SEX) 和 sd(PPED))。图中的密度 sd(Intercept) 明显远离零,表明在模型中包含此随机截距项的相关性。的随机斜率方差SEX 为0.382=0.140.382=0.14, 随机斜率方差 PPED 为0.262=0.070.262=0.07。这两种差异都不可忽视。但是,如果我们看一下密度图,两者的置信区间的下限 sd(SEX) 和 sd(PPED) 非常接近零,并且它们的密度也没有明确的从零分开。这表明可能不需要包括这两个随机斜率项。

我们还可以绘制跨学校的随机效应项。

#提取所有随机效应项的后验分布
RdEffct <- rf(aoFl)

#提取 "sd(Intecpt) "的后验分布
r_ec <- dRf$CI\[, , 1\] %>%。
  abbe() %>
  roton(var = "ID") %>%
  uae(Vrible = "d(Inercpt)")

#提取\`sd(SEX)\`的后验分布。
r_ <- dam$OD\[, , 2\] %>%>。
  astle() %>%。
  rnlmn(var = "ID") %>%
  mae(Vaiae = "sd(SEX)")

#提取\`sd(PPED)\`的后验分布
r_ED <-atdSH, 3\] %>%>。
  ate() %>%。
  rotcnr = ID") %>%
 ute(Vaiale = "sdPE)")

#绘图
r_ntct %>%
  bdows(r_EX) %>%
  biws(_PED) %>%
  mat(Coro= ifese(Q2.5*Q97.5 > 0, "no", "yes") ) %>%
  pot() +
  goint() +
  erbr(as(yin=Q2.5, ymx=Q97.5))

3a564387ff90b8d00e2afcb753f241f8.jpeg

同样,我们可以看到随机截距项 ( sd(Intercept))的后验分布在不同学校之间有很大的差异。他们中的很多人也远离零。因此,我们可以得出结论,包含随机截距是必要的。相比较而言,所有的后验分布的 sd(SEX) ,并 sd(PPED) 经过零,这表明有可能是没有必要在模型中包含两个随机斜率。

为了解释固定效应项,我们可以计算指数系数估计值。

##分类变量:SEX和PPED
exp(fif(BeoMiF)\[-4,-2\])

ba4ad3b08baeb951c1d5b5aec838b9cd.png

##连续的变量:MSESC

exp(fxf(BelFl)\[4,-2\]*sd(ul(i_o ))

2e9ee517a227f826f87d4cb2d5c8546c.png

我们可以看到,SEX、PPED和MSESC的影响与之前的模型结果非常相似。

参考

Sing, T., Sander, O., Beerenwinkel, N. & Lengauer, T. (2005)。 ROCR:可视化 R. 生物信息学中的分类器性能,21 (20),第 7881 页。http://rocr.bioinf.mpi-sb.mpg.de


5865a9c36475ea05087fdb443c321ec5.jpeg

点击文末“阅读原文”

获取全文完整资料。

本文选自《R语言贝叶斯广义线性混合(多层次/水平/嵌套)模型GLMM、逻辑回归分析教育留级影响因素数据》。

208199b18d323259a04a11bc78d0a897.jpeg

本文中的留级数据分享到会员群,扫描下面二维码即可加群!

012540dcc2a90450a99f0208434406f0.png

2f258446efac54f1217bcb3d8c4baea4.jpeg

0948e03a005e2017bc9e3656a874ea9c.png

点击标题查阅往期内容

R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据

多水平模型、分层线性模型HLM、混合效应模型研究教师的受欢迎程度

R语言nlme、nlmer、lme4用(非)线性混合模型non-linear mixed model分析藻类数据实例

R语言混合线性模型、多层次模型、回归模型分析学生平均成绩GPA和可视化

R语言线性混合效应模型(固定效应&随机效应)和交互可视化3案例

R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据

R语言 线性混合效应模型实战案例

R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据

R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状

R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

R语言建立和可视化混合效应模型mixed effect model

R语言LME4混合效应模型研究教师的受欢迎程度

R语言 线性混合效应模型实战案例

R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)

R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

R语言如何解决线性混合模型中畸形拟合(Singular fit)的问题

基于R语言的lmer混合线性回归模型

R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型

R语言分层线性模型案例

R语言用WinBUGS 软件对学术能力测验(SAT)建立分层模型

使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM

R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型

SPSS中的多层(等级)线性模型Multilevel linear models研究整容手术数据

用SPSS估计HLM多层(层次)线性模型模型

a10f5487ccd3eddba396aa493028baab.png

3e9593a73c0748f73f905452bda1dbbe.jpeg

013da5d93007ac38db6b939d482c4b74.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1036452.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

.NET 8 性能比 .NET 7 大幅提升

微软 .NET 开发团队的工程师 Stephen Toub 发表博客《Performance Improvements in .NET 8》&#xff0c;详细介绍了 .NET 8 中的性能改进。 介绍了 .NET 8 的性能表现&#xff0c;包括 JIT、原生 AOT、VM、GC、Mono、线程、文件 I/O、网络、JSON 处理、日志等。 .NET 7 was s…

数据结构与算法基础-(2)

&#x1f308;write in front&#x1f308; &#x1f9f8;大家好&#xff0c;我是Aileen&#x1f9f8;.希望你看完之后&#xff0c;能对你有所帮助&#xff0c;不足请指正&#xff01;共同学习交流. &#x1f194;本文由Aileen_0v0&#x1f9f8; 原创 CSDN首发&#x1f412; 如…

大模型的最大bug,回答正确率几乎为零,GPT到Llama无一幸免

目录 前言 1.名字和描述颠倒一下&#xff0c;大模型就糊涂了 2.实验及结果 3.未来展望 前言 大模型的逻辑&#xff1f;不存在的。 我让 GPT-3 和 Llama 学会一个简单的知识&#xff1a;A 就是 B&#xff0c;然后反过来问 B 是什么&#xff0c;结果发现 AI 回答的正确率竟然是…

Java正则表达式解析复杂跨行日志

Java正则表达式解析复杂跨行日志 解析内容正则使用完整代码 使用正则表达式解析日志 解析内容 String content "2023-09-23 11:31:54.705 INFO [ main] com.zlm.tools.ToolsApplication : Starting ToolsApplication using Java 1.8.0_201 on \n&qu…

SVG 基本语法

1. 概述 svg为可缩放矢量图形&#xff0c;使用 XML 格式定义图像。 2. 基础图形 2.1 矩形 &#xff08;1&#xff09; 基础语法 <rect x"20" y"20" rx"20" ry"20" width"150" height"100" fill"red&qu…

10.4Cookie和Session

一.概念: 二.相关方法: SendCookie: import javax.servlet.ServletException; import javax.servlet.annotation.WebServlet; import javax.servlet.http.Cookie; import javax.servlet.http.HttpServlet; import javax.servlet.http.HttpServletRequest; import javax.servle…

HDLBits-Edgedetect

刚开始写的代码如下&#xff1a; module top_module (input clk,input [7:0] in,output [7:0] pedge );reg [7:0] in_pre;always (posedge clk)begin in_pre < in;endassign pedge in & ~in_pre; endmodule但是提交结果是错误的。猜想原因如下&#xff1a; assign p…

关于地址存放的例题

unsigned int a 0x1234; unsigned char b *(unsigned char*)&a; 上面代码大端存储和小端存储的值分别是多少&#xff1f; 大端存储的是把高位地址存放在低位地址处&#xff0c;低位存放到高位。小端是高位存放在高位&#xff0c;低位在低位。因为a是整型&#xff0c;所…

Python 逢七拍手小游戏

"""逢七拍手游戏介绍&#xff1a;逢七拍手游戏的规则是&#xff1a;从1开始顺序数数&#xff0c;数到有7&#xff0c;或者是7的倍数时&#xff0c;就拍一手。例如&#xff1a;7、14、17......70......知识点&#xff1a;1、循环语句for2、嵌套条件语句if/elif/e…

java框架-Springboot3-基础特性+核心原理

文章目录 java框架-Springboot3-基础特性核心原理profiles外部化配置生命周期监听事件触发时机事件驱动开发SPISpringboot容器启动过程自定义starter java框架-Springboot3-基础特性核心原理 profiles 外部化配置 生命周期监听 事件触发时机 事件驱动开发 Component public c…

竞赛 基于深度学习的目标检测算法

文章目录 1 简介2 目标检测概念3 目标分类、定位、检测示例4 传统目标检测5 两类目标检测算法5.1 相关研究5.1.1 选择性搜索5.1.2 OverFeat 5.2 基于区域提名的方法5.2.1 R-CNN5.2.2 SPP-net5.2.3 Fast R-CNN 5.3 端到端的方法YOLOSSD 6 人体检测结果7 最后 1 简介 &#x1f5…

mybatis日志体系

title: “java日志体系” createTime: 2021-12-08T12:19:5708:00 updateTime: 2021-12-08T12:19:5708:00 draft: false author: “ggball” tags: [“mybatis”] categories: [“java”] description: “java日志体系” java日志体系 常用日志框架 Log4j&#xff1a;Apache …

华为云云耀云服务器L实例评测|搭建您的私人影院网站

前言 本文为华为云云耀云服务器L实例测评文章&#xff0c;测评内容是云耀云服务器L实例搭建在线视频网站&#xff0c;大家可以将这个网站作为私人影院或是分享给朋友&#xff0c;但是尽量不要更广的传播&#xff0c;因为这涉及到版权问题 系统配置&#xff1a;华为云 2核2G 3M…

PostgreSQL 16 发布,更可靠更稳健

&#x1f4e2;&#x1f4e2;&#x1f4e2;&#x1f4e3;&#x1f4e3;&#x1f4e3; 哈喽&#xff01;大家好&#xff0c;我是【IT邦德】&#xff0c;江湖人称jeames007&#xff0c;10余年DBA及大数据工作经验 一位上进心十足的【大数据领域博主】&#xff01;&#x1f61c;&am…

【LeetCode-简单题】513. 找树左下角的值

文章目录 题目方法一&#xff1a;DFS递归 前序遍历方法二&#xff1a;BFS层序双队列 题目 方法一&#xff1a;DFS递归 前序遍历 递归三部曲 确定递归函数参数和返回值确定递归结束条件编写常规递归体 本题只会在叶子结点才会去统计结果 也就是 root.leftnull&&root.r…

Flink DataStream API

DataStream API是Flink的核心层API。一个Flink程序&#xff0c;其实就是对DataStream的各种转换。具体来说&#xff0c;代码基本上都由以下几部分构成&#xff1a; package com.atguigu.env;import org.apache.flink.api.common.JobExecutionResult; import org.apache.flink.a…

AIGC百模大战

AIGC Artificial Intelligence Generated Content&#xff0c; 或者Generative Artificial Intelligence&#xff0c;它能够生成新的数据、图像、语音、视频、音乐等内容&#xff0c;从而扩展人工智能系统的应用范围。 生成式人工智能有可能给全球经济带来彻底的变化。根据高盛…

在树莓派上实现numpy的conv2d卷积神经网络做图像分类,加载pytorch的模型参数,推理mnist手写数字识别,并使用多进程加速

这几天又在玩树莓派,先是搞了个物联网,又在尝试在树莓派上搞一些简单的神经网络,这次搞得是卷积识别mnist手写数字识别 训练代码在电脑上,cpu就能训练,很快的: import torch import torch.nn as nn import torch.optim as optim from torchvision import datasets, tra…

spring-cloud-stream版本升级,告别旧注解@EnableBinding,拥抱函数式编程

spring-cloud-stream中&#xff0c;EnableBinding从3.1开始就被弃用&#xff0c;取而代之的是函数式编程模型 同期被废弃的注解还有下面这些注解 Input Output EnableBinding StreamListener 官方例子&#xff1a;GitHub - spring-cloud/spring-cloud-stream-samples: Sample…

电视访问群晖共享文件失败的设置方式,降低协议版本

控制面板-文件服务-SMB-高级设置&#xff0c;常规及其他里面配置即可。