统计学 课件 第3章 数据的描述
时间:2025-01-11
时间:2025-01-11
统计学 课件 第3章 数据的描述
第3章 数据的描述统计图与统计表 数据集中趋势的数值描述 数据离散程度的数值描述 数据分布的形态中央财经大学统计学院
统计学 课件 第3章 数据的描述
本章要回答的问题
常用的统计图表有哪些?如何绘制和解释 其含义? 通常使用哪些数值指标描述数据的特征? 如何计算?
中央财经大学统计学院2010
统计学 课件 第3章 数据的描述
§ 3.1 统计图与统计表
绘制统计图一般都需要先对数据进行统计 分组,在得到的频数分布表的基础上制图。
中央财经大学统计学院2010
统计学 课件 第3章 数据的描述
§zhi 3.1.1 统计分组与频数分布
统计分组:就是按照研究目的将数据分成 若干组的统计方法。 关键:选择分组变量和划分各组界限 例如按照考试成绩把学生分为优、良、中、 及格、不及格。 统计分组的结果是形成频数分布(分布数列, Frequency Distribution)。中央财经大学统计学院2010 4
统计学 课件 第3章 数据的描述
频数分布举例
两个构成要素:各组的分组界限 每组中的次数或频率 通过频数分布表可以发 现数据分布的特征。
成绩 60以下 60-70 70-80 80-90 90以上 合计
人数 频率 3 7.14% 8 19.05% 12 28.57% 15 35.71% 4 9.52% 42 100.00%
频数(frequency) :每个组中的数据个数,也称次数。
频率(relative frequency) :频数/总数据个数。中央财经大学统计学院2010 5
统计学 课件 第3章 数据的描述
分组方法分组方法按品质变量分组 按数量变量分组
单变量值分组 等距分组
组距分组 不等距分组
中央财经大学统计学院2010
统计学 课件 第3章 数据的描述
单变量值分组
将一个变量值作为一 组,适合于离散变量, 适合于变量值较少的 情况。 例如某学院2008年 毕业研究生毕业时 发表论文篇数的频 数分布表(右表)。
发表论 文篇数 2 3 4 5 6 合计7
人数 6 8 5 3 2 24
中央财经大学统计学院2010
统计学 课件 第3章 数据的描述
组距分组
将变量值的一个区间作为一组,适合于 连续变量,适合于变量值较多的情况。 分组必须遵循“不重不漏”的原则。 分为等距与不等距分组。 各组组距都相等时为等距分组。 为了避免有些组中的频数很少甚至 是空白的情况,有时也可以采用不 等距(异距)分组。 应用中可能需要把第一组和/或最后一组 设为开口组。中央财经大学统计学院2010 8
统计学 课件 第3章 数据的描述
组距分组的步骤1、确定组数:通常为5到15 (20)组。 Sturges 提出的经验公式:分组组数K应满足2K n,lg( n) K 1 lg( 2)
2、确定组距和各组界限,建议为5,10…的倍数。组距≈( 最大值 - 最小值)÷ 组数 3、根据分组整理成频数分布表中央财经大学统计学院2010 9
统计学 课件 第3章 数据的描述
组距分组中的基本概念
1、 下 限:一个组的最小可能值 2、 上 限:一个组的最大可能值 3、 组 距:上限与下限之差 4、 组中值:下限与上限之间的中点
值, (下限+上限)/2。
开口组的组中值可以按以下方法计算: 但许多作者认 缺下限:上限-邻组组距/2为无法计算开 口组的上限或 下限。
缺上限:下限+邻组组距/2中央财经大学统计学院2010 10
统计学 课件 第3章 数据的描述
等距分组表:上下组限间断某车间50名工人日加工零件数分组表 按零件数分组 105~109 110~114 115~119 120~124 125~129 130~134 135~139 合计 频数(人) 3 5 8 14 10 6 4 50中央财经大学统计学院2010 11
频率(%) 6 10 16 28 20 12 8 100
统计学 课件 第3章 数据的描述
等距分组表(上下组限重叠,上组限不在内)某车间50名工人日加工零件数分组表 按零件数分组105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计
频数(人)3 5 8 14 10 6 4 50中央财经大学统计学院2010 12
频率(%)6 10 16 28 20 12 8 100
统计学 课件 第3章 数据的描述
等距分组表:(使用开口组)某车间50名工人日加工零件数分组表 按零件数分组 110以下 110~115 115~120 120~125 125~130 130~135 135以上 合计 频数(人) 3 5 8 14 10 6 4 50中央财经大学统计学院2010 13
频率(%) 6 10 16 28 20 12 8 100
统计学 课件 第3章 数据的描述
3.1.2 列联表(Contingency table )
如果对数据同时根据两个变量分组,汇总得到的 结果称为列联表。列联表反映的是两个变量的联 合分布,可以用来分析两关变量之间的关系。也 称为交叉分组表(Cross tabulation)。 列联表一般根据两个定性变量进行编制,如果是 定量变量则需要先对单个变量进行分组。 列联表中的数字为交叉单元格中的频数或频率。 以列联表为基础可以对两个变量之间的关系进行 多种统计检验。中央财经大学统计学院2010 14
统计学 课件 第3章 数据的描述
列联表举例市场营销专业的男生有10人。
市场营销专业 男生 10
统计学专业 20
合计 30
女生 合计
30 40中央财经大学统计学院2010
15 3515
45 75
统计学 课件 第3章 数据的描述
3.1.3 常用统计图数据类型
定性数据
定量数据
条 形 图
饼 图
线 图
直 方 图
箱 线 图
茎 叶 图
中央财经大学统计学院2010