扫描仪ocr识别怎么设置(纸质档案数字复制件光学字符识别)
大家好,今天兑观科技小编又为大家分享档案管理干货了,本篇分享主要内容为——纸质档案数字复制件光学字符识别(OCR)工作规范篇一。
1.范围
本标准规定了纸质档案数字复制件光学字符识别(OCR)工作的组织、实施和管理。本标准适用于字迹清晰、文本规范的纸质档案数字复制件的光学字符识别(OCR)工作。
2.规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
DA/T13-1994档号编制规则
DA/T22-2015归档文件整理规则
DA/T31-2017纸质档案数字化规范
3.术语和定义下列术语和定义适用于本文件。
3.1 字符 character
供组织、控制或表示数据用的元素集合中的一个元素。[GB18030-2005,定义4.1]
3.2 字符集 character set
多个字符的集合。
注:常见字符集有ASCL字符集、GB2312字符集、BIG5字符集、GB18030字符集、 Unicode字符集等。
3.3 光学字符识别 optical character recognition;OCR
通过信息技术对图像文件中的字符形状进行识别、文字转换和文本输出、呈现的过程。
3.4 纸质档案数字复制件 digital copy of paper-based record
纸质档案经过数字化加工过程后形成的,存储在磁带、磁盘、光盘等载体上并能被计算机等电子设备识别的数字图像。
3.5 档案OCR成果 OCR outcome of record
记录通过OCR技术获取的纸质档案数字复制件文字内容的文件。
3.6 识别准确率 recognition accuracy
通过OCR技术识别正确字符的比率。
注:识别准确率=(识别正确字符数/应识别字符总数)×100%
3.7 识别速度 recognition speed
单位时间内通过OCR技术识别字符的数量。
4.总则4.1 档案OCR应当纳入数字档案馆(室)资源建设范畴,统筹规划,有序实施,逐步实现常态化。
4.2 档案OCR应当科学开展,以有利于实现档案信息检索和计算机辅助目、研开发、数据挖掘为原则。
4.3 档案OCR应当基于档案数字化工作,档案OCR成果与纸质档案数字复制件之间应建立准确、可靠的关联关系。
4.4 应当采取有效的管理和技术手段,加强档案OCR的过程管理和质量控制,确保档案OCR过程规范、成果可靠、数据安全。
4.5 涉密纸质档案数字复制件的OCR工作,应符合涉密档案相关的管理和技术要求。
若想了解更多关于档案管理最新动态,请参考兑观科技官网。
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com