扫描仪ocr识别怎么设置(纸质档案数字复制件光学字符识别)

大家好,今天兑观科技小编又为大家分享档案管理干货了,本篇分享主要内容为——纸质档案数字复制件光学字符识别(OCR)工作规范篇一。

扫描仪ocr识别怎么设置(纸质档案数字复制件光学字符识别)(1)

1.范围

本标准规定了纸质档案数字复制件光学字符识别(OCR)工作的组织、实施和管理。本标准适用于字迹清晰、文本规范的纸质档案数字复制件的光学字符识别(OCR)工作。

2.规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

DA/T13-1994档号编制规则

DA/T22-2015归档文件整理规则

DA/T31-2017纸质档案数字化规范

3.术语和定义

下列术语和定义适用于本文件。

3.1 字符 character

供组织、控制或表示数据用的元素集合中的一个元素。[GB18030-2005,定义4.1]

3.2 字符集 character set

多个字符的集合。

注:常见字符集有ASCL字符集、GB2312字符集、BIG5字符集、GB18030字符集、 Unicode字符集等。

3.3 光学字符识别 optical character recognition;OCR

通过信息技术对图像文件中的字符形状进行识别、文字转换和文本输出、呈现的过程。

3.4 纸质档案数字复制件 digital copy of paper-based record

纸质档案经过数字化加工过程后形成的,存储在磁带、磁盘、光盘等载体上并能被计算机等电子设备识别的数字图像。

3.5 档案OCR成果 OCR outcome of record

记录通过OCR技术获取的纸质档案数字复制件文字内容的文件。

3.6 识别准确率 recognition accuracy

通过OCR技术识别正确字符的比率。

注:识别准确率=(识别正确字符数/应识别字符总数)×100%

3.7 识别速度 recognition speed

单位时间内通过OCR技术识别字符的数量。

4.总则

4.1 档案OCR应当纳入数字档案馆(室)资源建设范畴,统筹规划,有序实施,逐步实现常态化。

4.2 档案OCR应当科学开展,以有利于实现档案信息检索和计算机辅助目、研开发、数据挖掘为原则。

4.3 档案OCR应当基于档案数字化工作,档案OCR成果与纸质档案数字复制件之间应建立准确、可靠的关联关系。

4.4 应当采取有效的管理和技术手段,加强档案OCR的过程管理和质量控制,确保档案OCR过程规范、成果可靠、数据安全。

4.5 涉密纸质档案数字复制件的OCR工作,应符合涉密档案相关的管理和技术要求。

若想了解更多关于档案管理最新动态,请参考兑观科技官网。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页