机器学习算法简介

时间:2025-05-01

第八章 机器学习算法简介邹权(博士) 计算机科学系

提要

8.1 机器学习问题8.2 机器学习算法 8.3 机器学习应用

8.4 WEKA平台简介

8.1 机器学习问题 概念 – 人工智能(Artificial Intelligence, AI) – 机器学习(machine learning, ML) – 模式识别(Pattern Recognition, PR) 研究内容 – 分类(classify)、聚类(cluster)、回归(regress) – 有监督学习(supervised learning) 、无监督学习 (unsupervised learning) 、半监督学习(semisupervised learning)

输入

数 据 采 集

预 处 理

特 征 提 取

分 类 器

分类结果

x

h

3.00

x2

红苹果 2.50

橙子 2.00

1.50 0.60 0.80 1.00 1.20 1.40

x1

待识模式

数据采集及预 处理

特征提取与选 择

识别结果 模式分类

分类 训练训练模式 数据采集及预 处理 特征提取与选 择 分类器设计

不同的分类方法效果不同

8.2 机器学习算法 分类 – 朴素贝叶斯(Native Bayes) – Fisher线性判别 – 支持向量机(support vector machine, SVM) – K近邻(k nearest neighbors, kNN) 聚类– K均值(K means)

贝叶斯分类器的错误率估计p 2 x p 1 x

贝叶斯公式

P( cj|x) =

P(x|cj)P(cj) P(x)

先验概率P(cj) 联合概率P(x|cj) 后验概率P(cj|x)

Bayes最小错误率决策例解

最小错误率 决策

两类细胞识别问题:正常类(ω1)和类异常(ω2) 根据已有知识和经验,两类的先验概率为:

正常(ω1): P(ω1)=0.9 异常(ω2): P(ω2)=0.1 对某一样本观察值x,通过计算或查表得 到: p(x|ω1)=0.2, p(x|ω2)=0.4 如何对细胞x进行分类? p(x|ω )1

p(x|ω2)

Bayes最小错误率决策例解(2) 利用贝叶斯公式计算两类的后验概率:

最小错误率 决策

P( 1 | x )

P( 1 ) p( x | 1 )

P( ) p(x | )j 1 j j

2

0.9 0.2 0.818 0.9 0.2 0.1 0.4 0.4 0.1 0.182 0.2 0.9 0.4 0.1

P( 2 | x )

P( 2 ) p(x | 2 )j j

P( ) p(x | )j 1

2

j argmax P ( i | x ) 1i

x 1

决策结果

Fisher线性判别函数分类器

Fisher准则的基本原理:找到一个最合适的投影 轴,使两类样本在该轴上投影之间的距离尽 可能远,而每一类样本的投影尽可能紧凑, 从而使分类效果为最佳。

机器学习算法简介.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219