时间序列时序关联规则挖掘研究(21)
发布时间:2021-06-06
发布时间:2021-06-06
时间序列时序关联规则挖掘研究
2.时间序列的预处理
时间序列一般都含有噪声数据,噪声数据的存在对时序关联规则挖掘产生很大的影响,因此,在挖掘前必须清洗。由于时间序列压缩对一般噪声数据具有一定容忍性而对孤立点噪声数据却没有容忍性,同时孤立点的存在会影响时间序列的分割和时间序列模式表示,所以识别和删除时间序列中的孤立点成为时间序列预处理的重要工作之一。本章把时间序列数据的跳跃程度作为判断数据是否是孤立点数据的标准进而提出数据相对变化率的识别方法。
2.1时间序列噪声数据及其分类
时间序列很容易受到噪声数据的侵扰。这些噪声数据的存在使时间序列关联规则挖掘可能陷入混乱,导致不可靠的输出结果。时间序列时序关联规则挖掘的目的是发现隐含在时间序列中的时序关联规则,噪声数据的存在一方面会降低规则的显著性,另一方面还有可能提供一些“假规贝州¨。因而,在挖掘时间序列之前,有必要对时间序列进行预处理,尽可能地清洗噪声数据。
噪声数据一般是指在测量时产生的随机错误或者偏差。有很多因素都可能引起噪声数据的出现,其中主要原因有:在数据收集时,本身就难以收集到十分精确的数据;收集数据的设备出现故障;在数据输入时出现错误;存储介质出现损坏等。引起时间序列具有噪声数据的起因各异,但是时间序列噪声数据大致有两类:第一类是掺杂在时间序列中异于原始数据的异类数据,比如收集时间序列的计算机出现故障,致使在时间序列中夹杂着与原始数据不同的数据;第二类是偏离序列期望值较大的数据,例如环境污染使得某一天的平均温度突然变化很大。在实际的时间序列中,很少出现异类噪声数据,10
下一篇:哲学选择题训练