P值及其计算方法 科研论文中p值和显著性水平的关系( 二 )


因此只要证明零假设是小概率事件就可以肯定对立假设了 。这或许是统计分析往往采用否定零假设的方式来做置信度判定的原因 。
于是我只需要真实地调查足够多的读者阅读本文的真实耗时,就可以算出P值 。P值是一个概率,取值在0和1之间,即绝对可能和绝对不可能之间 。
因此,如果P值为5%,则置信度就是95%(两个加起来=1),这反映出我的说法跟现实的关联显著性较高,因此较为可信 。
显然,如果零假设("……耗时小于10分钟")的发生可能性很低,即是个小概率事件,那么与之相反的对立假设("……耗时大于10分钟")的发生可能性就很高 。
小概率事件在单次测试当中几乎是不可能发生的,因此可以等同认为我的理论的单次断言是完全可信的(但不能说我的理论的全部断言都是可信的) 。

P值及其计算方法 科研论文中p值和显著性水平的关系

文章插图
P值是一个概率,是一个数,因此它可被用于衡量实验证据对结论的支持强度,并以下面的方式来做显著定性分析 。确定统计显著性有三种主要方法:
· 如果进行的检验得到的P值小于预设的α水平,则这个测试具有统计学显著性 。
· 如果置信区间不包含零假设的值,则检验结果具有统计显著性 。例如置信区间
· 如果您的P值小于α,在置信区间上不存在零假设的值,因此具有统计显著性 。(这是将前两点综合起来的推论)
注意:α值是人为预设的一个标准 。根据经验惯例,α值通常取0.05作为显著性的判定标准,取0.001作为极显著的判定标准,也就是说 。
· 较小的P值(通常≤0.05)表示实验结果是零假设不成立的有力证据,因此零假设可以比较可信地推翻 。
· 较大的P值(> 0.05)表示反对零假设的证据不充分,意味着零假设成立的几率偏大 。
· 极接近临界值(0.05)的P值被认为是边际性的(这有点信不信由你的味道) 。

P值及其计算方法 科研论文中p值和显著性水平的关系

文章插图
上图:概率及统计显著性示意 。纵轴是观察的概率,横轴是结果可能的取值 。
  • Very unlikely observations = 非常不可能的观察结果
  • Observed Result(value) = 观察结果(值)
  • 95% statistical significance threshold = 95%统计显著性门槛值
  • Observed p-value (statistic significance) = 观察到的p值(统计学显著性)
用一个栗子小结一下
例如,我刚在"饿了吗"上点了一份餐,饿了吗估算的送达时间是30分钟,但我坚持认为通常30分钟内都送不到 。
所以我可以进行一次假设检验,因为我认为"送达时间在30分钟以内"的零假设是不正确的,因此我的对立假设是"送达时间大于30分钟"(也就是说会迟到,要知道送餐迟到饿了吗就要赔优惠券,哈哈) 。
为了证实我的观点,我每天都点这同一家餐馆,并实测每次送达所花的时间 。
在获得了大量的样本数据之后,我计算了样本的P值,假设P值是0.001(远小于0.05),这意味着,我关于"送餐会迟到的判断会是错误的"的可能性大概是0.001,或者说我判断错误的可能性远小于0.05这个"统计学显著性的经验门槛值"。
因此,我基本上可以相信饿了吗自动估算的时间是错的,这样一来饿了吗每次都应该给我赔偿优惠券 。
但现实中这只是我的痴心妄想,基本上没可能,因为饿了吗公司的开发人员可没有那么傻 。他们一定会根据每次送餐的送达时间的统计情况,不断刷新它们的估算公式,以确保他们估算结果的P值

推荐阅读