2024考研一对一
圣才VIP会员,电子书题库视频免费看
您现在的位置: 圣才考研网 > 【笔记讲义】

应用统计学笔记——卡方检定

扫码手机阅读
用圣才电子书APP或微信扫一扫,在手机上阅读本文,也可分享给你的朋友。
评论(0

  本章是推论多项分布母体的母数,较实际的说法是推论二组以上独立样本的母数,重点是推论独立样本的适合度(test of goodness of fit)、独立性(test of independence)或齐一性(test of homogeneity)。

 

  在多项分布的情况下,其数据是得自类别或序位量度尺度的性质数列,通常是利用点计的次数来表示结果,或利用分组数据在各组出现的次数,换句话说,经过整理的数据是以次数分配表的型态出现,其推论的重点是推论独立样本所显现的特性是否符合理论值,或符合想象中的分布型态,这种目的的推论称为适合度检定(test of goodness of fit)。

 

  如果是推论独立样本间所显现的特性是否有相关性,这种目的的推论就称为独立性检定(test of independence)。

 

  如果是推论独立样本间所显现的特性是否有一致或相似性,这种目的推论就称为齐一性检定(test of homogeneity)。

 

  而这些检定都是次X2分布当作推论依据,所以统称为卡方检定(X2 test 或 Chi-square test)。卡方检定的每组样本最好皆大于5,否则就必须考虑合并或利用其他适当方法,以降低误差。卡方检定不必考虑母体是否常态分布或其他特定分布,所以是属于无母数检定法中的一种最常用检定法。

 

  卡方适合度检定:

 

  卡方适合度检定适合时机:

 

  卡方适合度检定(chi-square goodness-of-fit test)主要是推论单一多项母体里,类别随机变项所占的百分比或机率的分布情形,例如是否符合常态分布,或其他特殊型态的分布,或与某特定分布的情形是否相同等。

 

  多项母体的每一个类别随机变项皆视为一个独立的小母体(分层)。

 

  每一个类别随机变项样本出现的次数或频率(frequency),原则上不得少于5个(次),期望值也不得少于5个(次)。如果少于5个(次),则可行的方法是考虑用合并的方法,使其达到5个(次)以上。

 

  卡方适合度检定的步骤:

 

  选定显著水平α,通常由0.01、0.05和0.1三者中择其一,习惯上是选择0.05。

 

  设定多项母体随机变项的分布型态。

 

  只能使用X2分布的右尾检定,建立对应的虚无假设H0和对立假设H1,其型态如下:

 

  H0:符合某种特殊分布形态。

 

  H1:不符合某种特殊分布形态。

 

  由样本搜集得到,且经过整理的数据,依据随机变项或分组组数k,算出各项或各组出现的样本数或次数Oi,或计算各项或各组样本数或次数出现的百分比或机率Pi,i = 1,2,…,k。

 

  依据步骤2所设定多项母体随机变项的分布型态,算出各项或各组的机率值Pi或期望值Ei:

 

  Ei = nPi  n是样本总数。

 

  将各项或各组出现的样本数或次数Oi,各项或各组的期望值Ei,代入下列公式:

 

  

 

  df = k – 1

 

  得到的值。上式称为Pearson近似式也可以用机率值计算。

 

  查表得到大于而df=k-1的机率函数值,也就是而df=k-1的机率值。

 

  依据所选定的显著水平α、X2分布和右尾检定,查表得到临界值U(critical values)并订出接受区或拒绝区。由于X2分布是单峰右偏分布,在显著水平α的情况下,右尾检定临界值U是:

 

  

 

  如果的值或其对应的机率函数值在接受区,则接受虚无假设H0;如果在拒绝区,则拒绝虚无假设H0,接受对立假设H1。X2右尾检定的决策法则,也就是拒绝虚无假设H0的条件是:   

 

  依据所接受虚无假设H0或对立假设H1的条件作成结论。

 

  第七章 变异数分析

 

  变异数分析(Analysis of Variance,ANOVA),其分析的重点并不在于检验?变异数?。究其功能,其实是平均数检定的一种延伸技术,主要是用来检验二组以上样本平均数的一种方法。所以严格说来,变异数分析应当称为多元平均数检定(multiple mean hypothesis testing)方法,或许会更恰当些。

 

  变异数分析内容:

 

  一因子单变量变异数分析(one-factor ANOVA)与多元比较(multiple comparisons)。

 

  多因子单变量变异数分析(multi-factor ANOVA)以及其交互作用(interactions)的探讨与回顾。

 

  多变量一因子变异数分析(one-factor MANOVA)与多元比较部分。

 

  多变量多因子变异数分析(multi-factor MANOVA)以及其交互作用。

 

  因子(factor)是用来分析或区隔我们想要观测的依变量所使用的?解释?或?控制?方法(treatment)。这些因子的出现,其特性往往都是一种不连续的观测值。举例而言,例如我们对于人类身高(观测变量1)或者体重(观测变量2)的测度,试问是否可以使用一些其他的解释变量,来解说人类身高的差异现象?于是想到,我们或许可以使用性别(解释变量1)、或者人种(解释变量2)、或者血型(解释变量3)来作人类身高差异上的说明。值得注意的是,这些解释变量(因子)都不是连续的,而是类别式(categorical)的性质,或称为名目尺度(nominal scale)。

 

  所以或许可以这么说,变异数分析的基本想法在于将一群抽样的样本数据,依据某种标准划分成数个群组,其中作为分群的依据,称之为因子。至于分析几个不同的群组或水平(level),称之为?处理?(treatment)。如果仅使用?性别?一项,来解释人类在?身高?上的差异时,依据?性别?这样的分群方式称之为?因子?,区隔之后的子群体:?男性?与?女性?,称之为?处理?。

 

  一因子单变量变异数分析-以前述例子是使用单一因子(性别),来分析单一变量(身高)的分析方式。

 

  二因子单变量变异数分析-同时使用?性别?与?人种?二者,共同来解释单一变量(身高)的分析方式。

 

  多因子单变量变异数分析-由此类推我们可以持续增加许多其他可以解释身高的因子,例如加上?年龄?、?基因?、?营养?、?环境?、?运动量?等等多种因素,用来解释人类在身高这单一变量上的差异之处。这时由于使用解释因子不是只有一两个,这种方法即称之为?多因子单变量变异数分析?。

 

  暂且不论因子的个数多寡,由于所需要分析的观测变量一直只有一个(身高),所以这一类的分析方法,将一直维持在单变量变异数分析的范畴之内。

 

  但是,倘若有人想要?同时衡量?人类的身高与体重二者,在不同的情况之下有何差异,这样的想法,将脱离单变量的范畴,因为这时所衡量的依变量已经不只有一个,而是?同时衡量?身高与体重二者。

 

  一因子多变量变异数分析-我们使用单一的解释变量(例如性别),来同时衡量?身高?与?体重?二者。

 

  二因子多变量变异数分析-同时使用二个解释变量?性别?、?人种?,来衡量?身高?与?体重?二者。

 

  多因子多变量变异数分析-如果使用更多的解释变量,来同时分析?身高?与?体重?二者。

 


"'>)。人为误差包含调查(实验)员和被调查(实验)者所引起的误差。测量仪器的误差可以经由提高测量仪器的精密度而改善。非抽样误差出现的机会愈高,量度结果的精度愈低。精度是指对相同样本重复量度时,结果的差异程度,也就能得到正确量测答案的程度,又称为效度(validity)。

 

  原始资料的整理:整理的方法有二种,分别是人工整理法和计算机整理法。

 

  原始资料的分类:数据报含文字数据和数字数据,而且数据通常与时间、地区或空间有关,因此,整理数据时,必须依据简单化和系统化的原则,按照数据的特性,分别依序排列成一串数字,称为

  最新推荐:2016年考研成绩查询时间汇总(含34所高校) 

        2017年考研报考指南专题

 

  相关推荐:

  点击查看 >>>2016年考研复试调剂指导专题

  点击查看 >>>2016年考研成绩查询专题

  点击查看 >>>2016年考研真题汇总

 


 
  
  点击查看 >>>2017 考研动态 复试信息应试指导 经验心得 等。更多考研信息,敬请关注圣才考研网  
 

考研考博类电子书(题库)

查看全部>>

小编工资已与此挂钩!一一分钱!求打赏↓ ↓ ↓

如果你喜欢本文章,请赐赏:

已赐赏的人
最新评论(共0条)评论一句