非四格表如何做卡方检验?1. 数据加权 如果数据是汇总格式(如上图中的Total count data),则在进行卡方检验之前,需要先对数据加权。如果数据是个案格式(如上图中的Individual scores for each paticipant),则可以跳过“数据加权”步骤,那么,非四格表如何做卡方检验?一起来了解一下吧。
1、随机样本数据。
2、卡方检验的理论频数不能太小。
两个独立样本比较的3种情况:
1、如果理论数T<5但T≥1,并且1≥40,用连续性校正的卡方进行检验。
2、如果有理论数T<1或n<40,则用Fisher’s检验。
3、所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检验。
扩展资料
2*2列联表的卡方检验
2*2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。当用一般四格表的卡方检验计算时,
卡方值=n(ad-bc)^2/[(a+b)(c+d)(a+c)(b+d)],此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值=(|b-c|-1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。
1、首先打开SPSS,在栏中选中【打开-文件-数据】,选择一份要打开的数据表。
2、然后在打开的栏中,找到【分析-描述统计-交叉表】,如下图所示。
3、接着将【行-列】相关变量放在对应对话框中。
4、在对话框右边功能栏中点击【统计量】,接着勾选【卡方以及相关性】,交叉表就是卡方分析。
5、接着继续在右边功能栏中点击【单元格】,勾选【期望值】。
6、最后点击确定即可看到交叉表还有卡方分析统计结果,卡方值大于0.05即有显著性差异,即表示无统计学意义。
对问题的分析
研究者想分析多种购房人类型与多种房屋类型的关系,建议使用卡方检验(R×C),但需要先满足3项假设:
假设1:存在两个无序多分类变量,如本研究中购房人类型和房屋类型均为无序分类变量。
假设2:具有相互独立的观测值,如本研究中各位研究对象的信息都是独立的,不会相互干扰。
假设3:样本量足够大,最小的样本量要求为分析中的任一期望频数大于5。
本研究数据符合假设1和假设2,那么应该如何检验假设3,并进行卡方检验(R×C)呢?
三、SPSS操作
1. 数据加权
如果数据是汇总格式(如上图中的Total count data),则在进行卡方检验之前,需要先对数据加权。如果数据是个案格式(如上图中的Individual scores for each paticipant),则可以跳过“数据加权”步骤,直接进行卡方检验的SPSS操作。
数据加权的步骤如下:
在主页面点击Data→Weight Cases
弹出Weight Cases对话框后,点击Weight cases by,激活Frequency Variable窗口。
将freq变量放入Frequency Variable栏,点击OK。
2. 卡方检验(R×C)
在主页面点击Analyze→Descriptive Statistics→Crosstabs,弹出Crosstabs对话框。
概念
卡方检验是一种用途很广的计数资料的假设检验方法,由卡尔·皮尔逊提出。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较 理论频数和实际频数 的 吻合程度或拟合优度 问题。
** 例一**
我们想知道喝牛奶对感冒发病率有没有影响,以下为数据统计的四格表:
通过简单的统计我们得出喝牛奶组和不喝牛奶组的感冒率为30.94%和25.00%,两者的差别可能是抽样误差导致,也有可能是牛奶对感冒率真的有影响。
为了确定真实原因,我们先假设喝牛奶对感冒发病率是没有影响的,即喝牛奶喝感冒时独立无关的,所以我们可以得出感冒的发病率实际是(43+28)/(43+28+96+84)= 28.29%
所以,理论的四格表应该如下表所示:
即下表:
如果喝牛奶喝感冒真的是独立无关的,那么四格表里的理论值和实际值差别应该会很小。
那如何来描述这种差别呢,我们定义卡方值为
其中,A为实际值,T为理论值。
x2用于衡量实际值与理论值的差异程度(也就是卡方检验的核心思想),包含了以下两个信息:
根据卡方检验公式我们可以得出例1的卡方值为:
卡方 = (43 - 39.3231)平方 / 39.3231 + (28 - 31.6848)平方 / 31.6848 + (96 - 99.6769)平方 / 99.6769 + (84 - 80.3152)平方 / 80.3152 = 1.077
卡方值(理论值与实际值差异大小)的意义是什么呢?为此我们再引入一个概念:
卡方分布的临界值
上一步我们得到了卡方的值,但是如何通过卡方的值来判断喝牛奶和感冒是否真的是独立无关的?也就是说,怎么知道无关性假设是否可靠?
答案是,通过查询卡方分布的临界值表。
方检验的使用条件,一是随机样本数据;二是卡方检验的理论频数不能太小。要求每个格子中的理论频数T均大于5或1 当有T<1或1 扩展资料 卡方检验主要用于医学、生物学的统计,它是用途很广的一种假设检验方法,它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。 卡方检验主要可以用于处理计数数据的拟合问题。具体说,它可以检验单变量多项分类上的实计数和理论次数分布之间的差异显著性。 以上就是非四格表如何做卡方检验的全部内容,点击Statistics,勾选Chi-square、Risk和Cochran’s and Mantel-Haenszel statistics,点击Continue返回,点击OK完成操作。卡方检验是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用。