基于BP神经网络的手写数字识别研究

时间:2025-04-19

基于BP神经网络的手写数字识别研究

第25卷第4期

哈尔滨师范大学自然科学学报

NATURALSCIENCESJOURNALOFHARBINNORMALUNIVERSITY

Vol.25,No.42009

基于BP神经网络的手写数字识别研究

马 宁  常 (3

【摘要】 将,通过实验证实,该方法具有较高

;模式识别;图像处理;特征提取

0 引言

手写数字识别是光学字符识别技术的一个分支,研究如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字.由于手写体数字的随意性很大,例如,字体的大小、倾斜、笔画的粗细等等,

[1-3]

都会对识别结果造成影响.在过去的数十年中,研究者们提出了许多识别方法,取得了较大的

[4]

成果.手写数字识别技术的实用性很强,例如在大规模数据统计(人口普查、例行年检)、财务、保险、税务、邮件分拣等应用领域中都有广阔的应

[5~8]

用前景.手写数字识别一般通过基于结构的识别法及模板匹配法来进行处理,但识别率和可靠性都不高.为了提高识别率,就必须寻求新的方法和途径.近年来,BP神经网络技术取得了巨大发展,它是一种前馈反向型神经网络,具有并行处理信息、自组织、自学习信息等优点,特别适用于

[9]

模式识别领域.本文基于BP神经网络原理对手写数字进行识别,通过对1000个手写数字的识别,证实本方法在手写数字识别方面的有效性.

和功能以及若干基本特性,是一个高度复杂的非线性自适应动态处理系统.BP(BackPropagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一.BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程.它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小.BP神经网络模型拓扑结构包括输入层(input)、隐层(hidelayer)和输出层(outputlayer),如图1所示.

2 基于BP神经网络的手写数字识

2.1 输入向量与目标向量

1 BP神经网络

神经网络的概念、原理和设计是受生物、特别

是人脑神经系统的启发提出的.神经网络由大量简单的处理单元来模拟真实人脑神经网络的机构

收稿日期:2009-07-07

首先对手写数字图像进行预处理,包括二值化、去噪、倾斜校正、归一化和特征提取,生成BP神经网络的输入向量Alphabet和目标向量Tar2get.其中Alphabet选取40×10的矩阵,第1列到第10列代表0~9的数字.Target为10×10的单位矩阵,每个数字在其所排顺序位置输出1,其他位置输出0.

2.2 BP神经网络的构建

BP算法由数据流的前向计算(正向传播)和

3黑龙江省教育厅海外学人科研资助项目(1151HQ019);黑龙江省教育厅科研项目资助(11511138);黑龙江省教育厅重点学科

(081203);黑龙江省智能教育与信息工程重点实验室基金资助

基于BP神经网络的手写数字识别研究

90

哈尔滨师范大学自然科学学报2009

整wjk使全局误差E变小,即

Δwjk

p

(

=-=-Ep)=∑5wjk5wjkp=1

(5)

p

∑wjkp=1

式(5)中η为学习率.现定义误差信号为

(-δyj=-

ppj

=-Sjyjj

q

(6)

(3)=jq

t

j=1p

p

j

-yj)]

(7)

p2

=-图1 k=1

(tj-yj)

p

第二项为输出层传递函数f2(x)的偏微分

j’

=f2(Sj)Sj

将式(7)和(8)代入可得误差信号为

q

.正向传播时,传播方向为输入层→隐层→输出层,每层神经元的状态只影响下一层神经元.若在输出层得不到期望的输出,则转向误差信号的反向传播流程.通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程.

首先考虑正向传播,设输入层有n个节点,隐层有p个节点,输出层有q个节点.输入层与隐层之间的权值为vki,隐层与输出层之间的权值为wjk.隐层的传递函数为f1(x),输出层的传递函数为f2(x),则隐层节点的输出为

n

(8)

δyj=

∑(t

j=1

p

p

j

-yj)f2(Sj)

p’

(9)

则输出层各神经元权值△wjk调整公式将式(9)代入可定义为

q

pj

Δwjk=

p=1

η(t∑∑

j=1

-yj)f2(Sj)zk

p’

(10)

在得到输出层权值调整公式后,需要定义隐层权值△vki调整公式Δvki

(

=-=-Ep)=∑5vki5vkip=1

p

pp=1

(-p

5vki

(11)

zk=f1(

∑v

i=1p

ki

xi) k=1,2,…,p(1)

根据输出层各神经元权值△wjk调整公式推导过程,可得△vki为

p

q

输出层节点的输出为

yf=f2(

k=0

wjkzk) j=1,2,…,q(2)

Δvki=

p=1

pp’’

η()()(Sk)xit-yfSwfjj2jjk1∑∑j=1

通过式(1)和(2)可得BP神经网络完成n维到q

维的映射.

其次考虑反向传播.在反向传播中,需要对不理想的权值进行调整,BP神经网络的核心要务即在于调权.定义误差函数,设输入P个学习样本,

12p

用x,x,…,x来表示.第p个样本输入网络得到

p

输出yj(j=1,2,…,q),其误差为

Ep=

p

(12)

2.3 网络的训练

神经网络的训练过程是识别字符的基础,十分重要,直接关系到识别率的 …… 此处隐藏:1755字,全部文档内容请下载后查看。喜欢就下载吧 ……

基于BP神经网络的手写数字识别研究.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219