第三章 数据清理与基本统计分析
时间:2025-04-20
时间:2025-04-20
统计与测量课件
第三章 基本统计分析——数据的审核与整理
统计与测量课件
数据清理与基本统计分析是进行其 他分析的基础和前提。通过基本统计分 析,用户可以对分析数据的总体特征有 比较准确的把握,从而选择更为深入的 分析方法对分析对象进行研究。
统计与测量课件
数据检查与清理一是检查每个变量值的合理性(即发 现奇异数据与错误数据);二是检查各变 量值之间逻辑上的合理性。
SPSS操作步骤: “Analyze” ”Descriptive Statistics” ”Frequencies”
统计与测量课件
基本统计分析基本统计分析通常有两种形式:一是 通过一些特征量数来反映数据的分布情况; 二是以统计图表的形式直观呈现数据的分 布特征。 本章主要介绍平均数、中位数、众数、 方差、百分数、频数等基本概念,以及在 SPSS中如何进行计算操作。
统计与测量课件
数据的描述性测度 中心测度(Central tendency )平均数;中位数;众数
变化测度(Dispersion )全距;方差与标准差; 四分位数和四分位距;极值
形态测度(Distribution )偏度;峰度
统计与测量课件
(一)中心测度中心测度是指刻画数据集中趋势的数 字,用来描述数据的中心位于何处。 最常用的中心测度为平均数、中位数 和众数,其中平均数和中位数只适用于 定量数据,而众数既适用于定量数据, 也适用于定性(分类)数据。
统计与测量课件
(1)算术平均数(M) μ——总体算术平均数
X
——样本算术平均数
X1 X 2 X n X n
统计与测量课件
算术平均数的特性 所有观察值关于平均数的偏差和为零,即
(x
i
x) 0
对极值非常敏感。 所有观察值关于平均数的偏差平方和最小。
SS ( xi x) ( xi x j )2
2
统计与测量课件
算术平均数的计算 利用原始数据进行计算
X1 X 2 X n X n 利用频数分布表计算f1 x1 f 2 x2 f k xk X f1 f 2 f k f k 为第k组的频数;xk 为第k组的组中值。
统计与测量课件
用样本数据推断总体集中量时,算术平 均数最接近于总体集中量的真值,它是 总体平均数的最好估计值。 在计算方差、标准差、相关系数以及进 行统计推断时,都要用到它。
统计与测量课件
算术平均数的优缺点 优点 缺点
——反应灵敏 ——严密确定 ——简明易懂 ——适合代数运算 ——受抽样变动的 影响较小
——易受极端数值 的影响 ——一组数据中某 个数值的大小模 糊不清或不够确 切时无法计算
统计与测量课件
(2)加权平均数 加权平均数是不同比重数据(或平均 数)的平均数。用 X w或X t 表示。 其计算公式有两种形式
WX Xw W
ni X i Xw ni
统计与测量课件
(3)中位数 定义:中位数是把按从小到大(从大到 小)排列的一组数据一分为二的数值。 中位数的计算:
1. 用原始数据计算(分奇数个数据和 偶数个数据) 2. 利用次数分布表计算
统计与测量课件
统计与测量课件
利用次数分布表计算中位数(1)计算公式(由小向大计算)
Md Lmd
N i n1 2 f md
Lmd 表示中位数所在组的下限;N表示总频数; f md 中位数所在组的频数;
n1 表示小于中位数所在组下限的频数综合。
统计与测量课件
中位数的优缺点与应用优点:不易受极端值影响 缺点:不适合代数计算 应用条件: 一组数据中有特大或特小两极端数值时; 一组数据中两端数据或个别数据不确切、不 清楚时;
当需要快速估计一组数据的代表值时; 数据资料属于等级性质时。