p值是根据实际统计量计算出的显著性水平。是把置信区间临界值α的具体化。
举个简单的例子,比如黄博士汽车厂生产了一种XM牌的汽车,平均百米加速只要6.66秒。号称加速小钢炮,秒天秒地秒空气,还秒思域和飞度!
但是我不信,因为马自达、雷克萨斯才是我的信仰!孤独才是我的格调!
我来到你的城市,去了10个黄博士汽车4s专卖店,试驾了100辆XM牌汽车,每个车测了一下百米加速!最后算了一下这100辆车的百米加速,根本不是6.66,而是8.88秒!这哪是小钢炮,这是坦克!
于是我心中想起了两个字:闹他!(贵州方言)
但是,黄博士汽车说你这个结果不可信,我生产了100万辆XM牌汽车,你这100辆算什么?再闹起诉你!
你哭了!没关系,我们统计一下子,说明下问题!沉默加速度!
于是你学起了统计学。先看看我们的数据,100辆车的百米加速度是8.88秒,标准误差是1.11。
那么做一个原假设,写为Ho之类的:假设XM牌汽车的百米加速度就是6.66。(做假设只是为了推翻假设,为了搞事情!)
那么你调查的100辆车的百米加速度8.88怎么理解呢?8.88明显大于6.66啊,你说:立马闹他!
别急,,年轻人,世界上到处是偶然。——某某大师如是说。
你怎么说明你的8.88就是XM牌汽车的真实加速度呢,或者说怎么证明8.88大于6.66不是由于偶然造成的呢?
世界上最不缺少搞事情的人,事情搞得多了,就有了统计学。——某某大师如是说。
于是,我们统计一下子!为了说服力,为了思域和凌志,为了闹他!
于是,我们就想在原假设成立的时候(XM牌汽车的平均百米加速度是6.66秒),我们得到8.88秒的偶然性有多大?如果不大,就可以推翻原假设,就可以搞事情!
这个概率多小的时候,我们拒绝XM牌汽车的加速度是6.66秒的假设就合适?
You make choice!
不过,大师还说过:人们自我欺骗的自我相信,就叫规则。
于是,比如,我们可以说如果概率小于5%的临界值概率值α,我们就推翻原假设!
想搞事情的人多了就有了置信水平——置信水平α如是说。
此时我们假设XM牌汽车的加速度就是官方宣传的6.66秒;此时需要获取其标准差(由于每一个车子都不会具有完全高度相同的加速度,比如每个工人拧的螺丝的松紧程度都可能影响到那辆车的加速度,即世界上没有完全相同的两片叶子;标准差即样本距离均值的差异),但是厂家只说了加速度为6.66,没说加速度的标准差啊!这时就需要用我们手里的样本的标准差来估计一下整体的标准差了!无奈之举,厂家只说了平均数!
进行到这里要想闹他必须要用到统计中的概念了,对下面的细节不懂的老铁,需要去了解经典统计学中关于抽样分布、中心极限定理引出的置信区间估计、标准差的计算等内容(要想闹他不容易)。这时我们需要用我们调查到的100辆车的标准差1.11来估计样本量分布大小为100的抽样分布的标准差(计算过程为样本量为100的抽样分布的标准差1.11除以根号下100,结果为0.111,把其作为样本量为100的抽样分布的标准误差),然后进而构造出一个围绕均值6.66变化的95%信度的置信区间,(计算过程为6.66加减标准误0.111乘以95%概率分布的分位数,这满足一个统计学中所说的正态分布,正态分布的95%分位数大概是2(实际上准确的是1.96左右);这个过程就需要学习经典统计学了,入门推荐可汗学院统计学课程,尤其是其抽样分布的内容)。
最后我们计算出来的95%的置信区间是6.66±0.111×2。也就是说XM牌汽车有95%的概率其百米加速度应该在6.44—6.88的区间内(取两位小数)!
而我们调查到的结果是多少?8.88!远远不在这个区间内!拒绝!推翻原假设!闹他!
爱过不后悔,要搞狠狠搞——大饼的小屋语录。
所以,更进一步,我们这时候只知道8.88的加速度的概率小于5%,他到底是多少?
你到底爱不爱我?我想要那个真正的答案。——大师年轻时说。
于是我们又继续算了一下,把8.88放到100辆车的百米加速度的抽样分布的分布图上,得到8.88概率到底是多少?这样来反推加速度为8.88的概率。
结果一看只有0.1%(这是个假设值,具体值并不是这个,具体志可以通过查正态分布的z值表获得,但结果会是一个极小值)。
我们发现得到调查100辆车,其得到平均加速度为8.88秒,这件事情的概率从5%变成了0.1%,要千分之一的概率才能从6.66变成8.88啊!
让模模糊糊、随波逐流的的5%变的真切的0.1%,那就是P值。闹他!千分之一,平常剪子包袱锤二分之一的运气你都没有!
这时候,你却说:懂了P值,却不想闹他。糟了,确认了眼神,是爱上了XM牌汽车。不闹了,买车去。
世界总是充满了意外与偶然——某某大师还说。