博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
列联表(频数表)
阅读量:6840 次
发布时间:2019-06-26

本文共 650 字,大约阅读时间需要 2 分钟。

频数表是将数据集按照某个特定分类(分组)时观察每个类/组中数据出现次数的表;列联表也是频数表,只不过它会分析的是将数据集按两个或两个以上类别变量联合分组时观察数据在每个分组中出现频数的表,所以又称交叉分类表。

简介

特殊地,如果我们使用样本数据的两个属性构建列联表,而且每个属性只有两个等级,那么我们会得到两行两列的的列联表,又称2 × 2四格表。例如对随机抽取的1000个人按照性别(男/女)及色觉(正常/色盲)两个属性分组来构建列联表。一般地,如果我们使用数据集的两个属性AB来构建列联表,其中A有r个等级A1, A2, …. Ar,B有c个等级B1, B2, …Bc,那么我们最终会得到一个r行c列的列联表,简称r × c,nij为等级Ai和Bj处的频数。更一般地,如果我们使用多个属性构建列联表时,我们会得到多维列联表。

作用

列联表分析的基本问题是:观察各属性之间是否独立?如在前面的例子中,性别与色盲是否有关系?在r × c中,若以pi,pj,pij表示数据集中数据属于Ai等级的频数,属于Bj的频数及同时属于AiBj的频数(pi,pj属于边际概率,pij属于格概率),那么“A、B两属性无关”这个假设成立的可表述为H0pij = pi*pj

 

如果变量的无关假设被拒绝了,那么我们需要某种度量来刻画变量间的相关程度,例如对于r × c,可用列联系数来度量关联的程度。

转载于:https://www.cnblogs.com/wangyubo/p/4450730.html

你可能感兴趣的文章
Linux中断概述
查看>>
ubuntu 安装RPM软件包
查看>>
controller的frame
查看>>
c++实现队列
查看>>
Linux系统介绍(二)文件系统结构
查看>>
面试题目(1)
查看>>
描述一下Spring框架的作用和优点?
查看>>
二十五:设计模式的总结
查看>>
【HDOJ】1058 Humble Numbers
查看>>
【原创翻译】The Case for the Reduced Instruction Set Computer
查看>>
使用asp.net MVC4中的Bundle遇到的问题及解决办法
查看>>
js 全选,反选
查看>>
Android与iOS:谁更适合HTML 5?
查看>>
网络报错:“The connection is not for this device.”
查看>>
Java基础-Java中的堆内存和离堆内存机制
查看>>
Lists
查看>>
洛谷P1027 Car的旅行路线 计算几何 图论最短路
查看>>
MWC2015中的LTE软基站(转自GeeFlex)
查看>>
BurpSuite日志分析过滤工具,加快SqlMap进行批量扫描的速度
查看>>
C++ 的复制构造函数
查看>>