指导教师推荐意见(18)

时间:2026-01-13

图2-1 特征参数Ni的计算

Fig.2-1 Calculation of feature parameter Ni

在一行中黑色像素和白色像素产生了9次交替,因此算得Ni=9。

沿文本的倾斜方向:对纯文本区域的文字行,黑白像素的交替次数应该是很多的;而对文字行间的空白,黑白交替次数是很少的(几乎都是白的,理想情况下为0)。一般的文档,文字部分的行和行间距大致等宽,因此,取若干行进行计算,沿着文本的倾斜方向的Ni,就具有较大的方差;而沿非文本的倾斜方向,由于没有明确的文字行和空白行,因而求得的方差会明显变小。由此,构造函数V(θ):

1n

(2.1) V(θ)=∑(Ni M) ni=1

其中: 2

1n

M=∑Ni (2.2) ni=1

对不同的可能角度求V(θ),得到V(θ)函数,求该函数的最大值,对应的θ即为倾斜角度。

对于包含图表的区域,沿任意方向求得的黑白像素交替次数均应较小,而且对若干角度进行计算,沿各个方向的方差都不会很大。因此无法检出明显的峰值。

如图2-2所示,文字区域算出的V(θ)具有明显的峰值,而带图的区域没有明显的峰值。这也成为了区分文字区域和图表区域的一个判断准则。

该算法的具体步骤如下:

------------------------------------------------------------------------------

指导教师推荐意见(18).doc 将本文的Word文档下载到电脑

精彩图片

热门精选

大家正在看

× 游客快捷下载通道(下载后可以自由复制和排版)

限时特价:4.9 元/份 原价:20元

支付方式:

开通VIP包月会员 特价:19元/月

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219