电子商务教案7(17)
发布时间:2021-06-06
发布时间:2021-06-06
与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是,寻找观测结果与参照值之间有意义的差别。数据挖掘的任务是从大量数据中发现知识。
3 数据挖掘的过程
数据挖掘的过程如图7.4所示,过程中各步骤的大体内容如下:
图7.4 数据挖掘的过程
(1) 问题定义。在开始数据挖掘之前最先的也是最重要的要求就是熟悉背景知识,弄清用户的需求。要想充分发挥数据挖掘的价值,必须对目标要有一个清晰明确的定义,即决定到底想干什么。
(2)数据准备。这个阶段细分四步:数据收集、数据选择、数据预处理、数据转换 数据收集:大量全面丰富的数据是数据挖掘的前提,没有数据,数据挖掘也就无从作起。因此,数据收集是数据挖掘的首要步骤。
数据选择:搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据,从而辨别出需要分析的数据集合,缩小处理范围,提高数据挖掘的质量。
数据预处理:克服目前数据挖掘工具的局限,研究数据的质量,为进一步的分析做准备,并确定将要进行的挖掘操作的类型。
数据转换:将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的。建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。
(3)数据挖掘:利用各种数据挖掘方法对数据进行分析。
(4)结果分析:解释并评估结果。其使用的分析方法一般应作数据挖掘操作而定,通常会用到可视化技术。根据最终用户的决策目的对提取的信息进行分析,把最有价值的信息区分出来。
(5)知识的同化:将分析所得到的知识集成到业务信息系统的组织结构中去,并且通过决策支持工具提交给决策者。
上一篇:特色学校古诗文诵读