数据的整理和展示
时间:2025-03-10
时间:2025-03-10
统计
第二章 数据的整理和展示主要内容数据预处理、分类或分组、 汇总、制表、制图 排序、筛选 主要方法 编制频数分布表、分布图 编制统计表、统计图
统计
统计引例及原数据文件门店编号 所在区域 1 A 2 B 3 B 4 A 5 A 6 C 7 B 人数 8 11 9 8 10 9 9 销售额(万元) 利润(万元) 存货(万元) 35.3 2.9 12.1 41.1 3.8 15.2 34.9 2.6 12.5 32.6 2.7 11.4 38.9 3.2 13.6 43.1 4.1 16.1 35.2 2.8 12.3
※调查数据录入计算机后形成数据文件,一般格式如上表。 行代表各样本单位;列表示不同变量。 ※本例有50家门店,6个变量,数据文件为50行6列。 ※为解读数据,进一步分析该便利超市公司当月销售状况,需要 对数据加工整理。
统计
第一节 统计数据的整理整理是对统计数据以某种方式加以概括和提炼 一 筛选和排序 数据预处理的内容包括审核、筛选和排序。 审核 筛选 排序按要求将数据排列完整性 准确性 实用性 时效性 (二手数据)
①将不符合要求或有明显错误的数 据剔除 ②将符合某种特定条件的选出来
统计
根据调查中采用的编码、标识以及得到的数据,筛 选和排序可利用计算机完成。
排序
“数据”菜单→“排序”菜单项→选择排序关 键字→指定排序方式→“确定”
筛选
“数据”菜单→“筛选”菜单项→“自动 筛选”→选择需要的筛选条件→“确定”
统计
二 分组和频数分布 将总体各单位或全部数据按一定的标志划分成若干 类型组称为统计分组。 在分组基础上,汇总各组单位数并与各组值一一对 应排列,说明总体在各组间分布情况的分组形式称 为频数分布例表2-3表2-3 50家门店按区域分组 区域 频数 ( 门 频率( % ) 店家数) A 20 40 B 14 28 C 合计 16 50 32 100
频率
分组标志
频数
统计
分组标志组限 重叠? 不重叠?
例表2-5
频数(次数)
表2-5按月销售额分组所形成的等距数列
组距 大?小? 等?不等?
月销售额 频数 (门 频率(%) (万元) 店家数) 25-30 5 10 30-35 13 26 35-40 15 30 40-45 8 16 45-50 6 12 50-55 3 6 合计 50 100
累计频数 累计频率 (%) 5 10 18 36 33 66 41 82 47 94 50 100 — —
组数 多?少?
两头开口组形式: 30以下 … 50以上
统计
频数分布两要素:1 分组标志及其形式—— 根据数据特点设定数据种类 定性数据分组 定量数据分组 组距组值 例表2-5 等距 异距 开口组 闭口组
例表2-5
单项组值 例表2-4
例表2-6
2、频数(频率)——统计计数汇总的结果
统计
编制频数分布基本原则是穷尽、互斥组数、组距的确定 组数和组距的关系: 组距 = 全距 组数 根据数据本身的结构特点: 1)n的大小 2)数据分布的疏密程度 更多依赖整理者的主观判断、经验、试算
组限的确定
要能够反映
各组存在的质的差异对连续型变量,相邻组上、下限须重叠,给出端点所属; 对离散型变量,相邻组上、下限须衔接
统计
组中值、频数、频率和累计频率组中值含义: 1)组代表值 2)假定组内变量值均匀分布,故为近似代表值 等距数列时: 组中值=(上限+下限) 2 开口组时: 或 组中值=上限-邻组组距 2 =下限+邻组组距 2
累计频率含义:大于或小于某一变量值的频率之和。 求和方式:向上累计、向下累计
统计
用EXCEL工具编制频数分布 举例 定性数据的频数分布编制将文字标志用数值代码表示 → “工具” → “数据分析” → “直方图”→ 在“输入区域”键入原始数据 在“接收区域”键入代码 →选择“图表输出” →“确定”
定量数据的频数分布编制组距数列与前述过程不同的是: 确定组距和组限后,在“接收区域”键入各组上限值
统计
第二节 统计数据的图表展示经过整理的统计数据经过一定的加工计算后,以直 观的统计表、统计图展示,形成统计资料。一 统计表结构横 行 标 题 总表题 纵栏标题
统计数字
运用
1 总标题简明概括统计表的内容 2 数字栏不能出现文字和计量单位;无数字 以“—”表示;缺数字以“…”表示 3 必要时在表的下方加注释
统计
种类调查表 根据表的作用不同例表2-2 2-3
汇总整理表 计算分析表 截面数据表例表2-7 第一章例3-1表 2、表3 例表2-2
根据数据所属时间不同
时间序列表例表2-7等
根据分组变量的多少例表2-8、2-9
单变量分组表(简单分组表) 多变量分组表(复合分组表)
统计
总表题 横栏标题
上海市生产总值指数
分组表纵栏标题
上海市 其中 全 市 外贸出口 社会消费品 生产总值 第一产业 第二产业 第三产业 财政收入 商品总额 零售总额 一五 ”时期 13.8 3.3 18.4 8.3 18.9 30.6 5.6 “ 二五”时期 1.6 1.3 4.1 -3.1 6.2 4.2 1.2 1963 ~1965 17.1 11.6 21.8 5.6 10.5 11.4 -0.1 “ 三五”时期 8.7 3.3 9.7 5.7 6.5 2.5 3.3 “ 四五”时期 6.6 -1.6 7.1 6.2 5.2 20.7 8.4 “ 五五”时期 8.4 0.9 8.5 8.6 6.2 14.0 11.0 “ 六五”时期 9.1 4.3 8.2 12.3 5.8 -4.7 16.6 “ 七五”时期 5.7 1.2 5.0 8.0 1.5 9.6 14 “ 八五”时期 13.0 1.4 13.9 12.5 19.8 16.8 23.8 “ 九五”时期 11.4 3.4 9.7 15.1 20.1 17 12.2 “十五”时期 2001~2004 11.6 0.8 13.8 9.9 17.4 30.5 9.3 1953 ~2004 9.3 2.4 10.4 8.0 10.4 13.2 9.7
上一篇:室内装饰材料的选用
下一篇:BI数据仓库基础概念