Significance level 怎麼算？

Q: Significance level怎么算？

显著性水平是假设检验中的一个概念，是指当原假设为正确时人们却把它拒绝了的概率或风险。 它是公认的小概率事件的概率值，必须在每一次统计检验之前确定，通常取α=0.05或α=0.01。 这表明，当作出接受原假设的决定时，其正确的可能性（概率）为95%或99%。

Q: 如何确定零假设？

零假设确定思路 在假定零假设为真的前提下，确定样本分布形态和特征值（包括期望和方差）并选择合适的统计量，然后，确定包括接受域，临界值和拒绝域在内的决策标准；根据样本数据计算出统计量并将其与决策标准比后得出结论。

Q: Critical T value是什么？

临界值是在原假设下，检验统计量在分布图上的点，这些点定义一组要求否定原假设的值。 这组值称为临界或否定区域。 通常，单侧检验有一个临界值，双侧检验有两个临界值。 在临界值处，当原假设为真时，检验统计量在检验的否定区域中有值的概率等于显著性水平（用α 或alpha 表示）。

,T检验和F检验的由来

目錄 Show

浅谈p值（p-value是什么）
推荐阅读更多精彩内容
Significance level怎么算？
Significance F 是什么意思？
如何确定零假设？
Critical T value是什么？

一般而言，为了确定从样本(sample)统计结果推论至总体时所犯错的概率，我们会利用统计学家所开发的一些统计方法，进行统计检定。

通过把所得到的统计检定值，与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较，我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现，出现这结果的机率很少，亦即是说，是在机会很少、很罕有的情况下才出现；那我们便可以有信心的说，这不是巧合，是具有统计学上的意义的(用统计学的话讲，就是能够拒绝虚无假设null hypothesis,Ho)。相反，若比较后发现，出现的机率很高，并不罕见；那我们便不能很有信心的直指这不是巧合，也许是巧合，也许不是，但我们没能确定。

F值和t值就是这些统计检定值，与它们相对应的概率分布，就是F分布和t分布。统计显著性（sig）就是出现目前样本这结果的机率。

2，统计学意义（P值或sig值）
结果的统计学意义是结果真实程度（能够代表总体）的一种估计方法。专业上，p值为结果可信程度的一个递减指标，p值越大，我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联，我们重复类似实验，会发现约20个实验中有一个实验，我们所研究的变量关联将等于或强于我们的实验结果。（这并不是说如果变量间存在关联，我们可得到5%或95%次数的相同结果，当总体中的变量存在关联，重复研究和发现关联的可能性与设计的统计学效力有关。）在许多研究领域，0.05的p值通常被认为是可接受错误的边界水平。

3，T检验和F检验

至於具体要检定的内容，须看你是在做哪一个统计程序。

举一个例子，比如，你要检验两独立样本均数差异是否能推论至总体，而行的t检验。
两样本(如某班男生和女生)某变量(如身高)的均数并不相同，但这差别是否能推论至总体，代表总体的情况也是存在著差异呢？
会不会总体中男女生根本没有差别，只不过是你那麼巧抽到这2样本的数值不同？
为此，我们进行t检定，算出一个t检定值。
与统计学家建立的以「总体中没差别」作基础的随机变量t分布进行比较，看看在多少%的机会(亦即显著性sig值)下会得到目前的结果。
若显著性sig值很少，比如<0.05(少於5%机率)，亦即是说，「如果」总体「真的」没有差别，那麼就只有在机会很少(5%)、很罕有的情况下，才会出现目前这样本的情况。虽然还是有5%机会出错(1-0.05=5%)，但我们还是可以「比较有信心」的说：目前样本中这情况(男女生出现差异的情况)不是巧合，是具统计学意义的，「总体中男女生不存差异」的虚无假设应予拒绝，简言之，总体应该存在著差异。

每一种统计方法的检定的内容都不相同，同样是t-检定，可能是上述的检定总体中是否存在差异，也同能是检定总体中的单一值是否等於0或者等於某一个数值。

至於F-检定，方差分析(或译变异数分析，Analysis of Variance)，它的原理大致也是上面说的，但它是透过检视变量的方差而进行的。它主要用于：均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用、方差齐性(Equality of Variances)检验等情况。

3，T检验和F检验的关系

t检验过程，是对两样本均数(mean)差别的显著性进行检验。惟t检验须知道两个总体的方差(Variances)是否相等；t检验值的计算会因方差是否相等而有所不同。也就是说，t检验须视乎方差齐性(Equality of Variances)结果。所以，SPSS在进行t-test for Equality of Means的同时，也要做Levene’s Test for Equality of Variances 。

1.
在Levene’s Test for Equality of Variances一栏中 F值为2.36, Sig.为.128，表示方差齐性检验「没有显著差异」，即两方差齐(Equal Variances)，故下面t检验的结果表中要看第一排的数据，亦即方差齐的情况下的t检验的结果。

2.
在t-test for Equality of Means中，第一排(Variances=Equal)的情况：t=8.892, df=84, 2-Tail Sig=.000, Mean Difference=22.99
既然Sig=.000，亦即，两样本均数差别有显著性意义！

3.
到底看哪个Levene’s Test for Equality of Variances一栏中sig,还是看t-test for Equality of Means中那个Sig. (2-tailed)啊?
答案是：两个都要看。
先看Levene’s Test for Equality of Variances，如果方差齐性检验「没有显著差异」，即两方差齐(Equal Variances)，故接著的t检验的结果表中要看第一排的数据，亦即方差齐的情况下的t检验的结果。
反之，如果方差齐性检验「有显著差异」，即两方差不齐(Unequal Variances)，故接著的t检验的结果表中要看第二排的数据，亦即方差不齐的情况下的t检验的结果。

4.
你做的是T检验，为什么会有F值呢?
就是因为要评估两个总体的方差(Variances)是否相等，要做Levene’s Test for Equality of Variances，要检验方差，故所以就有F值。

另一种解释：

t检验有单样本t检验，配对t检验和两样本t检验。

单样本t检验：是用样本均数代表的未知总体均数和已知总体均数进行比较，来观察此组样本与总体的差异性。

配对t检验：是采用配对设计方法观察以下几种情形，1，两个同质受试对象分别接受两种不同的处理；2,同一受试对象接受两种不同的处理；3，同一受试对象处理前后。

F检验又叫方差齐性检验。在两样本t检验中要用到F检验。

从两研究总体中随机抽取样本，要对这两个样本进行比较的时候，首先要判断两总体方差是否相同，即方差齐性。若两总体方差相等，则直接用t检验，若不等，可采用t’检验或变量变换或秩和检验等方法。

其中要判断两总体方差是否相等，就可以用F检验。

若是单组设计，必须给出一个标准值或总体均值，同时，提供一组定量的观测结果，应用t检验的前提条件就是该组资料必须服从正态分布；若是配对设计，每对数据的差值必须服从正态分布；若是成组设计，个体之间相互独立，两组资料均取自正态分布的总体，并满足方差齐性。之所以需要这些前提条件，是因为必须在这样的前提下所计算出的t统计量才服从t分布，而t检验正是以t分布作为其理论依据的检验方法。

简单来说就是实用T检验是有条件的，其中之一就是要符合方差齐次性，这点需要F检验来验证。

转载自http://blog.sina.com.cn/s/blog_6d3f50e80100oodd.html

浅谈p值（p-value是什么）

当我们说到p-value时，我们在说什么？

“这个变量的p-value小于0.05，所以这个变量很重要”

........

你真的知道自己在说什么么？？？这个p-value到底是个什么鬼？为什么小于0.05就很重要？很重要是什么意思？？？？？

终于...

这次，我们通俗易懂地来讲讲到底什么是p-value（p值）。

在讲p-value之前，我们用掷硬币来举个例子。

硬币有正反两面，在概率中我们知道，出现正反面的概率各为50%（1/2），所以作为一个正常的硬币，如果我们投无限次后，结果一定会是正反各占50%。但是，如果我想知道自己手中的硬币，到底是不是正常的硬币，有没有做过手脚，在实际操作中是没办法投掷无限次的。因此，我们只能用有限的结果来判断“硬币是否为常规硬币”这个问题的答案。

在统计学上，做这个检验时，通常会设定一个虚无假设（也叫零假设，Null Hypothesis），通常记作H0。以及一个对立假设（Alternative Hypothesis），及与虚无假设对立的假设，如果证明虚无假设错误，则可以推出对立假设成立。

在掷硬币这个例子中，我们可以设定

H0: 手中的硬币是常规硬币

H1: 手中的硬币做过手脚

如果手中硬币是常规硬币，我们知道正面和反面出现的概率各为50%，所以如果我投掷10次硬币，则正面和反面出现的次数各位5次。正面5次，反面5次，就是我们对于投掷10次硬币的期望值（expected value）。

现在我们开始投掷硬币，出现的是正面3次，反面7次。这个结果就是我们对于投掷10次硬币的观测值（observed valued），即实际的结果。

通过分析期望值和观测值的差距，我们就可以判断出硬币是否正常。而这个期望值和观测值差距的判断方法就是chi-square。

Figure 1 chi-square计算公式

上图即为chi-square的计算公式，O代表观测值（observed value），E代表期望值（expected value）。有没有觉得这和方差的公式很像？没错，其实方差是一组数据与其均值的比较，而chi-suaqre是一组数据与另一组数据期望值的比较。

那么在掷硬币这个例子中chi-square（卡方）=(3-5)^2/5+(7-5)^2/5=1.6

Figure 2 掷硬币实验：观测值与期望值对比表

算出了chi-square，那么又怎判断检验结果呢？现在，跟我一起把卡方分布表(见Figure 2)拿出来~

Figure 3 卡方分布表

上图即为卡方分布表，左上角的α表示错误拒绝H0假设的概率（即虚无假设事实上成立，但我们计算出的结果却错误判断虚无假设不成立的概率）。n代表自由度（degree of freedom），即独立变量数减1，在这个例子中，独立变量数为2（正面和反面），所以自由度为1（2-1=1）。

当然，你也会见到与上图不一样的卡方分布图，比如Figure 3。P代表α，即P(当H0为真时拒绝H0)（其实就是p-value），df代表自由度（degree of freedom）。

Figure 4 卡方分布表

假设置信度为95%，即错误拒绝H0的概率为0.05。展开解释就是，我们有95%的概率确信检验结果正确，有5%的概率会错误拒绝虚无假设。（我们总说的p值与0.05比较就是这个啦，其实不一定时0.05，根据具体情况可以设置不一样的值，只是大部分时候都用0.05）

对照着卡方分布表（Figure 4），找到1所在的行（我们计算出的chi-square自由度是1），发现1.6是介于1.323和2.706之间，查表得出其p值为0.25到0.1之间，大于0.05，所以我们不能拒绝H0。换句话说，H0成立，即硬币是常规硬币，没有做手脚。

Figure 5 卡方分布表（chi-square=1.6）

大家通过观察卡方分布表能够发现，在用一个自由度下，chi-square越大，其p值就越小。举个极端的例子，如果在掷硬币的例子中，我投掷10次硬币，刚好5次正面，5次反面，则此时算是的chi-square为0（观测值与期望值一致），这时的p-value是远大于0.095，没有理由拒绝H0,H0假设成立，即硬币是常规硬币。

Figure 6 卡方分布表（chi-square=0）

总结一下，

p-value的作用：p-value就是用来判断H0假设是否成立的依据。因为期望值是基于H0假设得出的，如果观测值与期望值越一致，则说明检验现象与零假设越接近，则越没有理由拒绝零假设。如果观测值与期望值越偏离，说明零假设越站不住脚，则越有理由拒绝零假设，从而推出对立假设的成立。

p-value的计算：计算chi-suqare，计算自由度，查卡方分布表。

总的思路是，

做出H0,H1这对互斥的假设，计算出H0为真时的期望值，统计出实际的观测值，通过期望值和观测值求得chi-square（卡方），再通过卡方查表，得到p值。根据p值与α（1-置信度）的比较，如果p-value<α，则拒绝（reject）H0，推出H1成立；如果p-value>α，则接受（accpet）H0，推出H1不成立。

最后再划重点，把开头的几个问题再解释下。

【这个p-value到底是个什么鬼？】p值可通过计算chi-square后查询卡方分布表得出，用于判断H0假设是否成立的依据。

【为什么小于0.05就很重要？】大部分时候，我们假设错误拒绝H0的概率为0.05，所以如果p值小于0.05，说明错误拒绝H0的概率很低，则我们有理由相信H0本身就是错误的，而非检验错误导致。大部分时候p-value用于检验独立变量与输入变量的关系，H0假设通常为假设两者没有关系，所以若p值小于0.05，则可以推翻H0（两者没有关系），推出H1（两者有关系）。

【很重要是什么意思？】当p值小于0.05时，我们就说这个独立变量重要（significant），因为这个独立变量与输出结果有关系。

Significance level怎么算？

显著性水平是假设检验中的一个概念，是指当原假设为正确时人们却把它拒绝了的概率或风险。它是公认的小概率事件的概率值，必须在每一次统计检验之前确定，通常取α=0.05或α=0.01。这表明，当作出接受原假设的决定时，其正确的可能性（概率）为95%或99%。

Significance F 是什么意思？

Significance F：是指显著性检验度，这个值越小就代表因变量和自变量之间的关联性越显著，这里数值等于0.006，说明成本投入是影响广告曝光最显著的因素。 P-value：是指系数的显著性检验度，一般大于0.05就不具有统计学意义了，小于0.05说明具有统计学意义。

如何确定零假设？

零假设确定思路在假定零假设为真的前提下，确定样本分布形态和特征值（包括期望和方差）并选择合适的统计量，然后，确定包括接受域，临界值和拒绝域在内的决策标准；根据样本数据计算出统计量并将其与决策标准比后得出结论。

Critical T value是什么？

临界值是在原假设下，检验统计量在分布图上的点，这些点定义一组要求否定原假设的值。这组值称为临界或否定区域。通常，单侧检验有一个临界值，双侧检验有两个临界值。在临界值处，当原假设为真时，检验统计量在检验的否定区域中有值的概率等于显著性水平（用α 或alpha 表示）。

Significance level怎么算？ Significance F 是什么意思？如何确定零假设？ Critical T value是什么？显著水平p值 Significance level p value怎么算 P值怎么看解释 P value p value是什么 P值越大越好单侧检验

Significance level 怎麼算？

浅谈p值（p-value是什么）

推荐阅读更多精彩内容

Significance level怎么算？

Significance F 是什么意思？

如何确定零假设？

Critical T value是什么？

相關文章

怎么判断宝宝拉肚子

如何检验唐氏综合症？

空气炸锅可以加热食物吗

拉肚子能吃什麼

郵局卡解鎖要帶什麼？

肾不好的人不能吃什么？

拜月老準備什麼供品？

生粉是土豆淀粉吗

自住房屋稅查詢

什么是银行清算号？

廣告

最新消息

膽結石怎麼排出？

台糖蘋果醋ptt

母親節禮盒食品

战国立志传补丁

Turmeric 薑黃

请摘下星星给我英文名

香港机场快线车票

捕风捉影第一季

蔡英文一个中国

應用數學系好讀嗎？

廣告

Populer

廣告

關於

合法的

幫助

社會的