[汉字,管理工作,档案]浅析汉字识别技术在档案管(2)

时间:2025-05-09

信息,即固定在纸质载体上的汉字信息进行加工处理:扫描、识别、校对、修改等工序后形成的复制加工品,因此不具有档案的原始性。

  2、知识性是档案的又一个属性。档案的知识性是档案本身所得有的性质。经过汉字识别后的数据与原来纸张上的汉字是相同的。只是在汉字识别的过程中会存在和一定的误差,如果这些误差忽略不计,还保持着和档案原件相同的知识性。

  3、信息性。汉字识别后的数据信息只是存在的载体发生了变化,这种档案信息比纸质的文件档案更利于传播和利用,这种保存方式不会受到磨损和破坏。体现出一定的信息性。

  汉字识别后生成的文本数据应该说,它是一种新型的档案一次信息的复制品或编研开发成果。但作为一种新型的复制品或编研开发成果,因其生成的目的不同,又具有两种不同的属性:当以提供利用为目的通过汉字识别建立文本数据库时,其文本数据具有类似于汇编类档案编研成果的属性;当以编辑出版纸质的档案编研材料如大事记、组织机构沿革、文件汇编等为目的进行汉字识别时,其文本数据不仅具有类似于档案编研成果的属性,而且具有档案原始性的基本属性,因为它们是印刷品或出版物的本源信息。

  三、汉字识别技术的应用方式

  汉字识别技术在档案管理工作中的应用,主要适用于印刷汉字档案内容的识别,图像、文本数据的形成、存储和目录数据的录入等项工作。

  1、利用者阅读纸质档案的内容之后,对其所需要的内容进行扫描和汉字识别,或打印出统一格式的利用摘录,或直接提供文本拷贝。这种利用方式的优点主要有:首先,方便用户;这就是人们所说的打印和复印。复印的内容与原始材料的信息内容是一致的。用户在对档案的利用时可以根据档案的复印件来进行。这样有助于对档案原件的保存。同时,其信息可以进行多次利用。其次,不给档案人员增加建库的工作负担;原始的档案管理工作都是在档案馆中,将厚重的档案文件存放在档案馆中。档案管理的工作的人员,对档案文件的管理就是对纸质的文件进行管理。如果利用汉字识别技术,就可以将纸张上的汉字通过扫描存储在计算机中,由于计算机系统有着超大的内存
,所以可以存储较多的档案文件。这样就不需要建立更多的档案库来管理档案,只需在计算机上进行就可以了。最后,节省建库所需的经费开支。其缺点主要有:不能为全文检索提供数据,实现深层次开发档案信息资源的目的;存在对同一档案内容重复进行扫描和汉字识别的可能性。

  2、输入档案目录。这种输入

[汉字,管理工作,档案]浅析汉字识别技术在档案管(2).doc 将本文的Word文档下载到电脑

精彩图片

热门精选

大家正在看

× 游客快捷下载通道(下载后可以自由复制和排版)

限时特价:7 元/份 原价:20元

支付方式:

开通VIP包月会员 特价:29元/月

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219