化学情报检索系统的建立和发展二次文献--文摘最早开始于(编辑修改稿)内容摘要:

在检索时能得以快速响应,它的高速数据处理能力是原因之一,更重要的是通过软件对大量数据的组织,使其更容易存取。 对文献进行分析后,按一定的格式顺序存放在计算机中,形成顺序组织的数据文件( Sequential file)。 这种顺序组织的文件不具有良好的检索特性,查找任何一个文件都必须从头至尾扫描一遍,不可能有实时的响应,因此必须由计算机软件根据对检索功能和检索途径的定义, 从顺序文件中抽取相关的数据项目,并把这些数据项目排序,排序后的文件称为索引文件,或称为倒排文件( Invert file)。 如作者倒排文件即是把文献作者抽出建立的文献索引方式。 现在大多数检索系统是由数据库工具开发的,顺序和倒排文件被隐藏了。 书本文献与计算机文献的存储方式不同;计算机机读信息以数据库( Data base)形式存储,数据库是至少由一种文档组成、能满足特定目的或特定数据处理系统需要的数据集合,文档在此就是信息处理单位。 数据库分为三类: Reference Database Source database Data Bank Mixed database Bibliographic (书目 )database/directory(指南 ) database Numeric database Graphic database Terminological bank /textualnumeric database full text database Multimedia database 数据库的另一种划分方法是文献数据库 (以书目数据库和全文数据库为主 )和非文献数据库 (以数值数据库和术语数据库为主 )。 为使存储的信息能被捡出,需要对存入的信息进行标引 (indexing)。 标引 : 将信息中具有检索特征的词语或标志(索引点)抽出制成索引( index)的过程。 根据技术特点标引可以分为手工标引和自动标引两大类。 手工标引多采用正控词表;自动标引采用反控词表。 与词表相对应,索引也分为先组式和后组式,前者包括分类索引、主题索引等,后者以关键词索引、保留上下文索引系统( preserved context index system, . PRECIS)等为代表。 二、计算机检索的。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。