实现功能
使用scipy.stats模块中的chi2_contingency函数来执行卡方检验(Chi-square test)。卡方检验用于检验两个或多个分类变量(组别)之间是否存在显著关联(差异)。
例1:从某中学随机抽取两个班,调查他们对待文理分科的态度,结果,甲班37人赞成,27人反对;乙班39人赞成,21人反对,这两个班对待文理分科的态度是否有显著差异(α= .05)?
例2:探究(不同组)死亡年龄和居住地、性别是否有关(有显著差异)?
实现代码
from scipy.stats import chi2_contingency
# 例1:构建列联表(二维数组)
observed = [[37,27],
[39,21]]
# 执行卡方检验
statistic, p_value, dof, expected = chi2_contingency(observed)
# 打印结果
print("Chi-square statistic:", statistic)
print("p-value:", p_value)
print("Degrees of freedom:", dof)
print("Expected frequencies:", expected)
# 例2:构建列联表(二维数组)
observed = [[11.7,8.7,15.4,8.4],
[18.1,11.7,24.3,13.6],
[26.9,20.3,37,19.3],
[41,30.9,54.6,35.1],
[66,54.3,71.1,50]]
# 执行扩展卡方检验
statistic, p_value, dof, expected = chi2_contingency(observed)
# 打印结果
print("Chi-square statistic:", statistic)
print("p-value:", p_value)
print("Degrees of freedom:", dof)
print("Expected frequencies:", expected)
实现效果
本人读研期间发表5篇SCI数据挖掘相关论文,现在某研究院从事数据挖掘相关科研工作,对数据挖掘有一定认知和理解,会结合自身科研实践经历不定期分享关于python、机器学习、深度学习基础知识与案例。
致力于只做原创,以最简单的方式理解和学习,关注我一起交流成长。
邀请三个朋友关注V订阅号:数据杂坛,即可在后台联系我获取相关数据集和源码,送有关数据分析、数据挖掘、机器学习、深度学习相关的电子书籍。