第三章 数据清理与基本统计分析

时间:2025-04-20

统计与测量课件

第三章 基本统计分析——数据的审核与整理

统计与测量课件

数据清理与基本统计分析是进行其 他分析的基础和前提。通过基本统计分 析,用户可以对分析数据的总体特征有 比较准确的把握,从而选择更为深入的 分析方法对分析对象进行研究。

统计与测量课件

数据检查与清理一是检查每个变量值的合理性(即发 现奇异数据与错误数据);二是检查各变 量值之间逻辑上的合理性。

SPSS操作步骤: “Analyze” ”Descriptive Statistics” ”Frequencies”

统计与测量课件

基本统计分析基本统计分析通常有两种形式:一是 通过一些特征量数来反映数据的分布情况; 二是以统计图表的形式直观呈现数据的分 布特征。 本章主要介绍平均数、中位数、众数、 方差、百分数、频数等基本概念,以及在 SPSS中如何进行计算操作。

统计与测量课件

数据的描述性测度 中心测度(Central tendency )平均数;中位数;众数

变化测度(Dispersion )全距;方差与标准差; 四分位数和四分位距;极值

形态测度(Distribution )偏度;峰度

统计与测量课件

(一)中心测度中心测度是指刻画数据集中趋势的数 字,用来描述数据的中心位于何处。 最常用的中心测度为平均数、中位数 和众数,其中平均数和中位数只适用于 定量数据,而众数既适用于定量数据, 也适用于定性(分类)数据。

统计与测量课件

(1)算术平均数(M) μ——总体算术平均数

X

——样本算术平均数

X1 X 2 X n X n

统计与测量课件

算术平均数的特性 所有观察值关于平均数的偏差和为零,即

(x

i

x) 0

对极值非常敏感。 所有观察值关于平均数的偏差平方和最小。

SS ( xi x) ( xi x j )2

2

统计与测量课件

算术平均数的计算 利用原始数据进行计算

X1 X 2 X n X n 利用频数分布表计算f1 x1 f 2 x2 f k xk X f1 f 2 f k f k 为第k组的频数;xk 为第k组的组中值。

统计与测量课件

用样本数据推断总体集中量时,算术平 均数最接近于总体集中量的真值,它是 总体平均数的最好估计值。 在计算方差、标准差、相关系数以及进 行统计推断时,都要用到它。

统计与测量课件

算术平均数的优缺点 优点 缺点

——反应灵敏 ——严密确定 ——简明易懂 ——适合代数运算 ——受抽样变动的 影响较小

——易受极端数值 的影响 ——一组数据中某 个数值的大小模 糊不清或不够确 切时无法计算

统计与测量课件

(2)加权平均数 加权平均数是不同比重数据(或平均 数)的平均数。用 X w或X t 表示。 其计算公式有两种形式

WX Xw W

ni X i Xw ni

统计与测量课件

(3)中位数 定义:中位数是把按从小到大(从大到 小)排列的一组数据一分为二的数值。 中位数的计算:

1. 用原始数据计算(分奇数个数据和 偶数个数据) 2. 利用次数分布表计算

统计与测量课件

统计与测量课件

利用次数分布表计算中位数(1)计算公式(由小向大计算)

Md Lmd

N i n1 2 f md

Lmd 表示中位数所在组的下限;N表示总频数; f md 中位数所在组的频数;

n1 表示小于中位数所在组下限的频数综合。

统计与测量课件

中位数的优缺点与应用优点:不易受极端值影响 缺点:不适合代数计算 应用条件: 一组数据中有特大或特小两极端数值时; 一组数据中两端数据或个别数据不确切、不 清楚时;

当需要快速估计一组数据的代表值时; 数据资料属于等级性质时。

第三章 数据清理与基本统计分析.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219