小学资料: 一年级; 二年级; 三年级; 四年级; 五年级; 六年级; 小升初

初中资料: 初一; 初二; 初三; 中考

高中资料: 高一; 高二; 高三; 高考

课后答案: 补充习题; 练习与测试; 课课练; 同步练习; 其他习题

阅读训练: 阅读练习题; 古诗文鉴赏; 议论文阅读; 记叙文阅读; 说明文阅读; 应用文阅读

学习方法: 学习方法; 学习计划; 课堂听课; 复习方法

学科资料: 语文; 数学; 英语; 物理; 化学; 生物; 政治; 历史; 地理; 其它学科

范文文档: 工作总结; 工作计划; 工作报告; 心得体会; 论文大全; 名言句子; 文秘资料; 公文资料; 稿件大全; 评语大全; 祝福语大全; 观后感大全; 读后感大全; 节日庆典大全; 入团入党申请书; 经典范文

美文文档: 经典美文; 情感美文; 爱情美文; 哲理美文; 日记随笔; 励志故事; 语句摘抄; 经典语录; 签名说说; 微小说; 散文诗歌; 优美句子

作文文档: 小学作文; 初中作文; 高中作文; 优秀作文

教育文库: 幼儿教育; 小学教育; 初中教育; 教学研究; 专业资料; 资格考试; 教育文库; 外语考试; 高等教育; 求职职场; 高中教育; 实用文档

数据挖掘Apriori算法C++实现

时间：2026-01-09

- --

一、原Apriori算法

1、算法原理：

该算法的基本思想是：首先找出所有的频集，这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则，这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则，产生只包含集合的项的所有规则，其中每一条规则的右部只有一项，这里采用的是中规则的定义。一旦这些规则被生成，那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集，使用了递推的方法

（1）L1 = find_frequent_1-itemsets(D); // 挖掘频繁1-项集，比较容易

（2）for (k=2;Lk-1 ≠Φ;k++) {

（3）Ck = apriori_gen(Lk-1 ,min_sup); // 调用apriori_gen方法生成候选频繁k-项集

（4）for each transaction t ∈D { // 扫描事务数据库D

（5）Ct = subset(Ck,t);

（6）for each candidate c ∈Ct

（7）c.count++; // 统计候选频繁k-项集的计数

（8）}

（9）Lk ={c ∈Ck|c.count≥min_sup} // 满足最小支持度的k-项集即为频繁k-项集

（10）}

（11）return L= ∪k Lk; // 合并频繁k-项集（k>0）

2、算法流程

①首先单趟扫描数据集，计算各个一项集的支持度，根据给定的最小支持度闵值，得到一项频繁集L1。

②然后通过连接运算，得到二项候选集，对每个候选集再次扫描数据集，得出每个候选集的支持度，再与最小支持度比较。得到二项频繁集L2。

③如此进行下去，直到不能连接产生新的候选集为止。

④对于找到的所有频繁集，用规则提取算法进行关联规则的提取。

3、算法的不足：

（１）数据库重复扫描的次数太多。在由ＣＫ寻找ＬＫ的过程中，ＣＫ中的每一项都需要扫描事务数据库进行验证，以决定其是否加入Ｌｋ，存在的频繁Ｋ－项集越大，重复扫描的次数就越多。这一过程耗时太大，增加了系统１／０开销，处理效率低［１０］，不利于实际应用。

（２）产生的候选集可能过于庞大。如果一个频繁１－项集包含１００个项，那么频繁２－项集就有Ｃ２

１００个，为找到元素个数为１００的频繁项集，如｛ｂ１，ｂ２，…，ｂ１００｝，那么就要扫描数据库１００次，产生的候选项集总个数为：

举例：

对于一个这样庞大的项集，计算机难以存储和计算，挖掘效率低下。

二、算法的改进1

1、改进方法：

性质１：频繁项集的所有非空子集都必须是频繁的。（Ａｐｒｉｏｒｉ性质，记为性质１）

性质２：若频繁Ｋ－项集Ｌｋ中各个项可以做链接产生Ｌｋ＋１

，则Ｌｋ中每个元素在Ｌｋ中出现的次数应大于或等于Ｋ，若小于Ｋ，则删除该项在Ｌｋ中所有的事务集［１１］。（Ａｐｒｉｏｒｉ性质的推论，记为性质２）

改进的方法：在连接之后得到的候选频繁k项，直接进行最小支持度判断，并进行剪枝，从而直接得到频繁k项集，避免候选项集可能过大的问题；

2、算法的流程

①首先单趟扫描数据集，计算各个一项集的支持度，根据给定的最小支持度阈值，得到一项频繁集L1。

- . -word资料-

数据挖掘Apriori算法C++实现.doc 将本文的Word文档下载到电脑

下载这篇word文档

上一篇：并列句详解与复习含中考真题解析

下一篇：私人定制计划书

精彩图片

猜你喜欢

热门精选

经典双语美文：加油为了心中的梦想

美文赏析：花开向暖，素锦留香

经典美文：花开向暖，素锦留香

经典美文：青春如歌，携一份懂得同行

在雨中静听自己的心跳美文

浅谈当今大学教育的含金量双语美文

大家正在看

题库：仪表技术人员考试试题含答浙江省杭州市2013-2014学年高二上学防洪评价报告编制导则中北大学实习报告农村公共卫生服务项目考核表邢旭--市场调查报告施工单位安全管理制度内容完整版无棣施工组织设计