我来举个形象点的例子比如同学们风传你和女神的绯闻(比作研究xx分子和xx疾病有木有关系)。同学们偷拍了几十张你们在一起的照片,然后分析你们同时出现是缘于巧合(抽样误差)还是确有其事。此时无效假设H0:你们是清白的,备择假设H1你们真的在一起了。用某种神奇的统计学方法分析了一下你们同时出现在一张照片上到底是巧合还是真事。如果p<0.05,按发文章的套路讲,就认为你们在一起了。如果p>0.05,就认为你们没啥特别的。但事实呢?未必如统计得出的这样。如果是p<0.05时犯的错误,就是你们本来是清白的,却认为你们在一起就是1类错误。如果是p>0.05时犯的错误,就是你们其实在一起了,但却骗过了大家,认为你们没好上,这就犯了二类错误。研究里面常见的一个一类错误的例子就是,一组患者、一组病人,各测了二十个指标,比了二十次t检验(每个指标比一次),p选择0.05, 很可能这二十个指标在两组间都没什么区别。但即使抽样误差随机撞大运都能找出一个指标两者有区别。这是一个典型的犯一类错误的例子,本来没差别,撞大运弄出了0<0.05有差异。
P-值是在原假设为真的条件下某一统计量的取值以其观察值为最小值或最大值的事件的小概率,或说某一统计量的取值以其观察值为最小值或最大值是一个小概率事件,此小概率就是 P。(我所理解的)P值的各路定义:在一个假设检验问题中,利用观测值能够做出拒绝原假设的最小显著性水平称为 P-值。对于 P-值的理解,一般情况下有这几种认识:(1) 拒绝原假设的最小显著性水平。(2) 观察到的(实例样本的) 显著性水平。(3) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。(4) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。(5) 我们在拒绝原假设的犯的最小的第一类错误,而所规定的显著性水平(具有主观性)是事先给定的犯第一类错误的最大错误。以上基本就是我所知道的关于P值的各种解释了。对于了解统计学的人,相信稍微思考就应该能够会心一笑,哈哈;对于不懂统计学的人,可以看一些基本的书籍,假设检验虽然重要,但是描述性的统计一样蕴含着古老的化繁为简的智慧。
p值的含义是,在数据满足指定假设条件的情况下(例如xxxx满足正态分布一类的),如果我们认为H1假设成立,但是H1假设其实不成立的概率。实用中这是一个值得注意的坑。例如我们在回归分析找能影响y的x的时候,如果我们设定5%的p值作为显著水平,同时我们有一大堆x,实际上x和y一点关系都没有,但是平均每试验20个x,就会有一个的p值小于5%(5%的出现概率)。这也是为什么在用统计方法研究问题的时候前提假设推理非常重要,因为你只要试验的因变量足够多,总会有一个显著的。另外扯下时髦的大数据。所谓大数据真正的意义在于,由于数据如此之大,导致数据间有关联时获得的p值如此之低,H1假设其实不成立的概率几乎就是零,这样问题的前提假设推理也就并不重要了
。






