为了更好地理解p值、显著性水平、置信水平的概念,先看一个例子:
小明和小红聚餐时打赌,小明说 下一把骰子掷出的数值一定大于1,谁输了谁买单。小红盘算着要不要和小明打赌:
原假设H0:值=1;备择假设H1:值>1。
p值:已知骰子6个值出现的概率都是1/6,也就是原假设成立的概率是1/6≈16.7%。
这个p值=16.7% 既是原假设成立的概率,也是小红犯弃真错误 猜错的概率。所以原假设成立的概率和犯弃真错误的概率都是p值的定义,虽然提法不同,但表达的是一个意思。
如果小红是风险保守型,希望自己赢的概率大一点,也就是置信水平(1-α)等于90%,显著性水平α=10%,那这个p值的概率就太大了,比预想alpha的大,可能就不打这个赌了;如果小红是进取型,想搏一搏单车变摩托,赢率有个80%也不错,也就是置信水平(1-α)等于80%,显著性水平α=20%,那p值小于α,猜错的概率比预想得低,可以进行打赌。
p值的定义:p值是原假设H0成立的概率,也是极端结果出现的概率。也称为犯弃真错误的概率,犯一类错误的概率。
p值大小说明什么:p值很小,说明原假设H0成立的概率很小,则可以拒绝原假设;p值如果比较大,说明原假设H0发生的概率则比较大,则不能拒绝原假设。
p值存在的意义:p值的目标是推翻原假设,描述的是原假设成立的概率;如果计算出来的结果极其小,根据小概率原理,我们有理由拒绝原假设。
α的概念:α(alpha)叫弃真错误(一类错误)的概率,本来H0是正确的,却被否定了的概率(如果这个概率极小,那可以默认H0不会发生了);也叫显著性水平,值定得越小,要求的精度越高。
α起到的作用:α(alpha)相当于一个阈值。需要事先设定,可以理解为是预想的值,一般取0.05或0.01。
p值&显著性水平α:p值与α进行比较,p值小于阈值,说明H0发生的概率很小,比预想的要小,可以拒绝H0;p值大于阈值,则说明H0成立的概率比预想的要大,则不能拒绝H0。