国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书内容摘要:

定工序,扫描或数码拍摄;预处理(遵循标准);数据整合;图象 12 编辑处理;版面还原等处理;格式转换;检查、校对;数据封装(全部元数据、对象数据);数据刻盘;数据输出至服务器;磁盘清理;生成归还清单等 (6) 特殊文献数字化 专业设备组建的特殊文献生产线。 文献包括超大幅面地图、拓片、实物、珍贵古籍等。 由于文献的特殊性,在生 产过程中,强调生产工艺和工序环节,注重文献的细节处理。 特殊文献生产要求、设定条件、生产时间、人员、文献保护等等,根据对象和任务具体情况,设置参数指标和生产线工序。 基本工序同普通古籍善本生产线,特殊工序的添加,需在任务加工初期配置。 (7) 缩微品数字化 针对 16 毫米、 35 毫米、平片等缩微制品, 进行数字化处理。 系统支持专业硬件设备接口,并将设备处理的数字文件导入生产系统,完成进一步的编辑处理。 工序可根据对象的文献类型,进行生产线配置,如图书、报纸、期刊、善本等文献。 (8) 音频、视频数字化(采集;导入) 合理组织、 配置生产线,使硬件系统与软件系统实现高指标的的生产效率。 音视频文献的数据来源包括模拟资源( VHS)和原生数字资源( DV、 DVD、VCD),所以数据的生产流程又分为数据采集和数字转换。 由于音视频文件的加工大多采用专业软件或编码器来完成,所以音频、视频加工生产线系统应注意与第三方软件的接口问题。 生产主要过程如下: 原始资源组织整理 〉建立工作目录 〉文件数字化 〉质量检查 〉数据保存 (9) 其它 数字化 临时或指定的 生产 任务。 根据具体需求,在工艺、工序、加工等参数表中,自动组配、定制生产线系 统。 比如对购买数据的格式转换、封装、拆分、命名,或更加深入数字处理对象文件。 (10) 对硬件设备和专业处理软件配置管理功能 13 能与专业采集处理设备进行良好的集成,能根据处理工序中对设备参数的配置要求,基于硬件设备所提供的接口对硬件设备进行参数控制。 能与专业处理软件进行良好集成,能根据处理工序和工艺中对专业处理软件的参数配置要求,基于专业处理软件所提供的接口对处理软件进行参数控制。 (11) 数字水印处理 对文献数字化产生的 对象数据 进行水印处理。 根据数字水印处理策略 ,按照工序流程,对 文档、图片、 音视频 数字资源加盖数字 水印, 数字对象的水印属性 可以记录在相关元数据中。 数字水印处理可以作为一项独立的功能,嵌入到文献数字化生产支撑软件中。 数字水印处理功能支持 可见水印和隐形水印 的处理,提供数字水印查看工具。 隐形水印 应有安全性。 (12) 元数据的生成 与管理 包括管理型在内的各类元数据 的生成贯穿于整个 文献数字化处理 的过程中, 并 在文献数字化 的各个环节中 会 不断的补充与完 善。 描述性元数据的获取与完善 需要根据不同种类的文献数字化工序而定。 (13) 唯一标识的和成 与 唯一标识符 注册 根据中 心管理系统的唯一标识管理策略对生 成的对象数据分配与指定唯一标识,并按唯一标识符系统的注册格式要求,向唯一标识符系统注册 并获取数字对象 唯一标识符。 内部唯一标识的生成和 唯一标识符注册 将 作为生产环节 的 两个 功能 模块配置到各类文献数字化的流程工序中。 二、文献数字化标引系统 (1) 书目编辑 提供书目数据的编辑,以及书目与数字对象的挂接处理。 能提供多种书目的编制方法:外部数据导入、相近记录拷贝、人工录入等。 能够按基本元数据进行字段提取与处理;能够区分数据各个字段,并按要求在 CNMARC、DC、 XML 或其他元数据格式、数据库之间的转换。 要求具有检索、剔重、 唯一标识处理的能力,且能够分配唯一资源标识符。 (2) 篇名标引 14 提供多种制作方法:数据导入; OCR 识别;人工录入等;提供目次、书目、摘要、数字对象的挂接;建立目次到资源的唯一对应关系;校验、检查 (3) 摘要标引 主要处理摘要信息与对象实体进行连接;对于基本元数据进行提取与处理;提供多种制作方法:数据倒入; OCR 识别;人工录入等;提供目次、书目、摘要、其他元数据与数字对象的挂接,建立唯一定位关系;校验、检查 (4) 自定义内容标引 版面指定内容 置标( OCR 识别、人工录入、数据导入 );多媒体指定段落置标( OCR 识别、语音识别、 人工录入、数据导入 );置标位置信息、与其它载体管理关系的记录; 校验、检查 (5) 全文 数字化处理 (手工录入 ;或 OCR 识别 ) 生成 ISO270 XML、 HTML、 PDF、 TXT、等格式和元数据转换;商业数据格式转换;支持多种加工方式;多种校验方式;检查 (6) 编辑管理 专用文字输入编辑管理工具,可以处理横排、竖排的输入;可以使用多种输入方法;可以进行多种信息编码之间的转换;可以支持形码、音码的输入;有多重输入比较的能力,版式预览的能力,支持基准的 XML 文件结构,含位置信息(对应加工图像)、可转换进入通用的文本编辑工具中 (7) 数字水印处理 对标引后形成的全文数据,在必要时可以作为对象数据来看待。 当这些全文数据作为对象数据时 ,其发布与服务必须受到版权的约束,因此标引生产系统也需要具有数据水印处理 功能。 根据数字水印处理策略,按照工序流程,对数字对象加盖数字 水印, 数字对象的水印属性可以记录在相关元数据中。 数字水印处理可以作为一项独立的功能,嵌入到标引生产支撑软件中。 (8) 字符集外管理 可建立 Unicode 字形字库,提供简单容易正确操作的输入方法,检索指定字形的字,对外字进行自动查重。 可建立和修改字形曲线库、字的结构图、字音、自给编码等外 字库,建立外字的属性。 建立数字资源与外字的关联表。 15 提供外字输入、检索、查重和统计。 提供输出外字功能。 根据 Unicode 版本升级,修改外字库,并可按需要修改已做数字资源中相关外字的编码。 该部分功能需要与中文信息处理系统子项目所购软件提供的功能进行整合。 (9) 元数据的生成与管理 数字资源标引生产过程所产生的元数据,一般都以元数据的形式保存。 所产生或补充的元数据信息包括描述型元数据、管理型元数据等。 元数据的属性字段规范需要在软件需求分析时进一步分析确定,原则 上尽量采用国图标准。 (10) 对硬件设备和专业处理软件 (主要是 OCR) 配置管理功能 能与专业采集处理设备进行良好的集成,能根据处理工序中对设备参数的配置要求,基于硬件设备所提供的接口对硬件设备进行参数控制。 能与专业处理软件进行良好集成,能根据处理工序和工艺中对专业处理软件的参数配置要求,基于专业处理软件所提供的接口对处理软件进行参数控制。 (11) 标引生产管理 根据任务生产通知单,按照要求分发到相应的标引生产线;根据具体任务设定生产流程、工序,掌握和控制生产进度和数量;数据 接收(输入);置标字段管理,实现自定义字段名称和属性、任意选择字段、自动灵活组配标引数据库; 统计及报表输出;人员角色、权限管理;生产线数据库维护;文件系统管理,包括对象文件、元数据和备份数据;数据输出。 三、文献数字化中心管理系统 文 献数字化中心管理系统是与文献数字化生产文献数字化标引配置的管理系统,一方面实现 文献数字化加工中心 日常生产管理所需要的功能,另一方面实现事后统计分析功能。 (1) 任务管理 包括任务定制和管理。 根据文献类型、任务要求,生成任务单。 调用工序工艺管理相关指标,与任务单一起发至生产线。 根 据生产线完成人员的不同(馆内 文献数字化加工中心 、馆内其他业务 16 部门和馆外加工企业),负责任务下达、质量监督、工程过程控制、标准制定等。 (2) 人员权限管理 系统管理员、子系统管理员、操作员的帐户、密码、权限的管理。 (3) 接收管理 接收生产线外数据;接收生产线各个模块应用数据库数据;根据参数化管理来适应底层不同数据库和操作系统的不同数据传输格式的需要。 (4) 工序工艺管理 不同加工对象的工序工艺的配置。 设置各种 相关 设备的参数,设置存储方式方法,设置数据格式转换要求,设置检查与校对的方式等。 针对不同加工对象的数字化生产工序工艺 的缺省设置,要符合国图实际的数字化加工规范要求。 对于 生产 流程的管理与任务分配,应充分考虑对服务器的支撑能力 ,以及终端处理 过程的支撑能力。 工序工艺配置信息可与定制任务进行匹配。 提供色彩、实物管理。 对于实物扫描 、 拍照等的色系、拼图体系进行管理,主要是色基的管理、 生产 设备与 处理 参数说明、实体说明、数据格式、拼图 等 (5) 数据库管理 对形成的各类数字资源的库进行维护管理,并有相应的功能应对生产过程需要的配置。 (6) 文件管理 对形成的各类文件进行维护管理,并有相应的功能应对生产过程中需要的调整。 (7) 数据 输 出管理 管理、输出各 个文献数字化加工过程中产生的过程文件、资源数据格式、加工数据格式、元数据、对象数据。 提供批量、增量等多种输出方式。 对于输出可以根据加工任务时间、加工任务的质量检查、完成的批量等进行控制输出转移。 加工完成前输出到临时存储区域,验收完毕,转移到资源储藏存储区域。 对于输出任务形成一个可管理的、可检查的清单文件标签,便于再 17 加工、转移、存储使用。 (8) 软 硬件接口 参数配置 管理 负责有关 扫描仪、摄像系统、非线性编辑系统、音频视系统等各种设备的驱动、格式转换和格式控制等参数配置信息 的管理。 根据工序的不同 调整和设置 相应的硬件设备 参数。 根据工艺的需要,转换各种设备输入输出的格式。 负责对 配属的专业 处理软件 的相关参数的配置管理 , 根据工序的不同调整和设置相应的 专业处理软件参数。 (9) 版权 信息 登记 根据需要对数字资源的版权信息进行登记。 (10) 数字化产品移交 管理 可定时批量或单独将 生产 审校通过的数字化成品 , 自动生成移交电子通知单,送至数字资源 集中保存与管理系统 ,接收电子回执,并回送收到的通知回执。 处理过程信息自动记录到加工记录中。 (11) 统计管理 对工作人员、加工时间、加工数量、数据成品、生产过程(工序)等各个方面进行统计。 统计结果可打印、可显示棒形图、 饼形图、表格,并可按时间输出电子表格。 (12) 快速印刷 根据已有的书目记录和数字资源目录进行查重、确认。 提供待印刷清单,并通知 快速印刷 系统。 任务批准后,进行质量检查,包括数据的完整性、顺序关系、版权关系、文献状态。 (13) 数字成品管理 (包括介质管理) 能够管理各种存储介质的出入库。 对新介质和成品盘的出入库、库内报废以及库内丢失都进行计算机管理,使介质的管理系统化。 查询各种介质的使用情况。 用户可以方便的查询成品盘的情况以及盘中图书。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。