单样本的t检验 指样本的均值是否某个值存在差异。
比如一包薯片标的克重为50g,但每包不一定都是50g,那么我们可以对薯片进行随机抽样,检验它与50g是否有差异。
1 提出假设:
原假设:薯片的平均重量是50g;
备择假设:薯片的平均重量不是50g。
如果检验薯片是否小于50g是单侧检验,检验薯片是否和50g存在差异是双侧检验。
2 定显著性水平:
对精度要求不太高,显著性水平一般用0.5,我们计算出p值之后,要与显著性水平进行比较,如果返回的p值小于显著性水平,则拒绝零假设,即认为样本数据与总体均值有显著差异。
3 导入样本数据:
junk_food = [58.530, 52.353, 74.446, 52.983, 55.877, 67.660, 47.726, 50.267, 56.501, 52.361, 45.458, 53.361, 52.129, 59.828, 41.682, 49.399, 64.211, 69.859, 42.911, 60.159]
junk_food
4 对样本数据进行t检验:
# t检验
stats.ttest_1samp(junk_food, 50)
代码详解:
scipy库中的ttest_1samp函数,可以用来进行样本t检验;
50代表假设的总体均值;
返回的结果statistic代表t值,pvalue代表p值;
结果是返回的p值0.0127小于显著性水平0.5,所以我们拒绝原假设,即认为样本数据与总体均值有显著差异。也即认为薯片的重量与50g存在显著性差异。