第11章 数据挖掘聚类分析
发布时间:2021-06-05
发布时间:2021-06-05
数据挖掘
数据挖掘
聚类分析
数据挖掘
引言 “物以类聚,人以群分”。对事物进行分类,是人们认识 事物的出发点,也是人们认识世界的一种重要方法。因此, 分类学已成为人们认识世界的一门基础科学。 在生物、经济、社会、人口等领域的研究中,存在着大量 量化分类研究。例如:在生物学中,为了研究生物的演变, 生物学家需要根据各种生物不同的特征对生物进行分类。 在经济研究中,为了研究不同地区城镇居民生活中的收入 和消费情况,往往需要划分不同的类型去研究。 在地质学中,为了研究矿物勘探,需要根据各种矿石的化 学和物理性质和所含化学成分把它们归于不同的矿石类。 在人口学研究中,需要构造人口生育分类模式、人口死亡 分类状况,以此来研究人口的生育和死亡规律。
数据挖掘
但历史上这些分类方法多半是人们主要依靠经验作定性分 类,致使许多分类带有主观性和任意性,不能很好地揭示 客观事物内在的本质差别与联系;特别是对于多因素、多 指标的分类问题,定性分类的准确性不好把握。 为了克服定性分类存在的不足,人们把数学方法引入分类 中,形成了数值分类学。 后来随着多元统计分析的发展,从数值分类学中逐渐分离 出了聚类分析方法。 随着计算机技术的不断发展,利用数学方法研究分类不仅 非常必要而且完全可能,因此近年来,聚类分析的理论和 应用得到了迅速的发展。 聚类分析就是分析如何对样品(或变量-在多元统计中,它 就是一个向量)进行量化分类的问题。通常聚类分析分为 Q型聚类和R型聚类。Q型聚类是对样品进行分类处理,R 型聚类是对变量进行分类处理。
数据挖掘
什么是聚类 聚类(clustering)就是将数据分组成多 个簇(cluster),使得同一个簇的对象之 间具有较高的相似度,不同簇的对象相异 早在孩提时代,人就通过不断改进下意识中 的聚类模式来学会如何区分猫和狗、动物和 植物
数据挖掘
聚类无所不在
数据挖掘
聚类无所不在
数据挖掘
聚类无所不在
数据挖掘
聚类的应用领域
数据挖掘
有贡献的领域
数据挖掘
什么情况下应该聚类
数据挖掘
聚类分析原理
数据挖掘
数据挖掘
数据挖掘
数据挖掘
数据挖掘
数据挖掘
数据挖掘
聚类与分类
数据挖掘
相似性及其度量 从复杂数据中提取相对简单分组结构的主要 工作是找到一个“紧密度”或相似性度量 “当我们看到它的时候,我们即可领会” 基于特征来测量相似性 产生特征 提炼特征 规范化特征 减少特征
上一篇:现浇板施工图设计注意事项
下一篇:风电专业考试题库