数据分析基本原理介绍(基于excel)

时间:2026-01-20

excel数据分析

第一讲:数据分析基本原理介 绍(基于excel工具)主讲人:邓光耀

excel数据分析

1、数据分析概述 1.1定义:数据也称观测值,是实验、测量、观察、调查 等的结果,常以数量的形式给出。数据分析的目的是把隐 没在一大批看来杂乱无章的数据中的信息集中、萃取和提 炼出来,以找出所研究对象的内在规律。在实用中,数据 分析可帮助人们作出判断,以便采取适当行动。数据分析 是组织有目的地收集数据、分析数据,使之成为信息的过 程。 1.2 通常需分析的数据有商务与经济数据、医药统计数据、 游戏运行数据等。数据分析工作者需要有多学科背景,首 先要对所分析的对象要有比较全面的了解。 1.3 数据分析的常规方法是用excel做统计表与统计图,专 业方法有RFM模型、回归分析、时间序列分析、聚类分 析、神经网络、正交设计、方差分析、结构方程模型、关 联分析等。这些方法的具体内涵等用到时再讲。

excel数据分析

1.4 常用的数据分析软件简介: spss软件是全球范围内最流行的数据分析软件; sas软件具有比较强大的编程功能,适合专业人士 使用;eviews软件进行计量经济分析的人员用得 比较多;dps软件是浙江大学唐启义发明的数据分 析软件,它是目前唯一的中国人自己发明的数据 分析软件,是spss软件与excel的山寨版;其它的 数据分析软件还有gauss与minitab等。这些软件 的基本功能都差不多,只是侧重点有些差别。 excel也有数据分析功能,对于一般的数据分析用 excel也就足够了,本讲后面讲述excel函数与绘 图功能。

excel数据分析

1.5 数据分析的一般步骤: 1、数据的收集、整理、录入、校对等; 2、对收集的数据进行描述性统计分析,选 择数据分析的方法。 3、利用已知数据建立模型,发现数据的内 在规律,并利用模型对未来作出预测或者 做出理性的决策。 4、比较预测的数据与现实数据,校正模型, 提高预测的准确性或者做出更理性的决策。

excel数据分析

2、判定数据计算错误的办法 2.1 在数据收集的过程中,或多或少会出现 数据误差或者错误。数据校对工作者有必 要掌握一些判定数据计算错误的办法。当 然多算几次会提高计算的准确率,但是数 据较多时,如何快速有效的判定计算的正 误就需要一些专业的方法了。 2.2 位数估计与首位、末尾数据校对法:这 是一个简单的办法,当你没有时间来校对 数据时可以采用此法做些粗略的判断。

excel数据分析

2.3 弃九法:此法的数学原理是利用同余的性质。 我们先从例子开始叙述: 加法: 例1:假设商品一的销售金额为1568964元,商品 二的销售金额为3625878元,统计表上两者的结 果为5194742元,问此表

有没有问题?我们计算 1568964的各位数字的和,注意超过9就取除以9 的余数即可,这样我们可以口算得到数字3,同理 3625878可以用弃九法得到数字3,5194742用弃 九法得到数字5,由于3+3=6不是5,故可以判定 数据计算有误。 减法:我们可以先转化到加法,再用弃九法判断。

excel数据分析

乘法: 例2:假设某件商品的单价是137元,销售量为 128793件,经计算得到17653741,判断此计算结果 的正误。137用弃九法处理等于2,128793经处理等 于3,那么2×3=6,17653741经处理等于7,故可以判 定数据计算失误。我们用正确的数据来验证弃九法的 合理性,正确结果应该是17644641,此数经弃九法 处理等于6,满足弃九法。 除法:我们可以先转换到乘法,再用弃九法处理。 弃九法的数学原理:记 an a2a1 10n an 10a2 a1

excel数据分析

那么此数除以九之后所得余数与各位数字相加除 以九之后得到的结果相同。即由于10n an 9 (10n 1)an 9 an 9

10a2 9 9a2 a2 9

a1 9 a1 9

即an a2a1 an a2a1 (mod9)

excel数据分析

最后一个式子表示两边除以九后的余数相同,是同 余理论中的符号。 不知道听者有没有发现,用弃九法判断计算的正 确性有时候失效,实质上用此法判断计算正误, 如果判断计算是错误的,那么一定是计算错了, 但是判断是正确的,却实质上计算不一定正确。 例如上面的乘法的例子,如果我们计算得到 17554641,那么按照弃九法,不能判断出此结果 是错误的,但是实质结果应当是17644641。 不过由于出现计算错误的原因一般是忘记进位, 或者用计算机计算时少输入一个数字等,故用弃 九法来检验计算的正确性还是比较有效的。

excel数据分析

3、描述性统计 3.1 频数与频率:频数指样本中某数据出现的次数; 频率指频数除以样本的数目。 例3:我们分析下列数据:1 3 3 4 2 3 4 4 3 1 5 3 2 3 1 4 5 3 2 4

上面数据中2出现的频数为3,频率为3/20=0.15。 我们在RFM模型中会遇到这样的数据组。

excel数据分析

我们用excel函数求上面数据的频数与频率:假如我们依 次把以上数据输入在A1到A20中,那么我们可以在B1中用 countif函数计算2出现的频数,即输入=countif(A1:A20,2) 即可得到2的频数为3;我们在B2中输入=B2/20或者 =countif(A1:A20,2)/20即可。 注: 1.我们可以用=count(A1:A20)计算这组数据的个数。 2.当数据很多时,用excel函数计算频数与频率是个很好的 办法。 3.用spss等数 …… 此处隐藏:1361字,全部文档内容请下载后查看。喜欢就下载吧 ……

数据分析基本原理介绍(基于excel).doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:4.9 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:19元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219