第七章信息检索技术内容摘要:

interactive)的方式从计算机存贮的大量数据中自动分拣出用户所需要的信息。 计算、比较、选择的匹配任务是由机器来执行的,而人则是整个检索方案的设计者和操纵者。 计算机检索的优势 计算机检索明显优于手工检索,主要表现: 检索的信息量大、 数据更新快、 检索功能强、 检索结果输出的多样性。 第二节 信息检索数据库(工具) • 检索工具(数据库)的功能 • 检索工具(数据库)的分类 • 检索工具(数据库)的构成 检索工具(数据库)的功能 事实检索、目录检索、文摘索引检索。 其关联关系如下图: 1)事实检索 事实检索是对包括事实( fact)、数值( numeric data)与全文( fulltext)的检索,提供原始信息,给出直接、确定性的答案。 它回答的问题诸如: “ 我国最近一年在 《 SCI》 上被收录的文献量是多少。 ” “ 有哪些海外华人得过诺贝尔奖。 ” 工具: 字典、词典( dictionary) 百科全书( encyclopedia) 年鉴( annual, yearbook, almanac) 手册( handbook, manual) 名录( biography)和书目指南( directory) 数据库属于源数据库:全文数据库、数值数据库、文本-数值数据库、术语数据库、图象数据库、多媒体数据库 2)目录检索: 目录检索是间接的、相关性检索,给出来源文献线索,指引原始文献。 按性质:登记书目(出版、馆藏情况)、科学通报书目等; 按所涉的学科范围:综合书目、专科书目、专题书目等; 按所涉的时间范围:回溯书目、在版书目、新书书目等; 按收录的文献类型:图书目录、报刊目录、来源目录等; 按所涉的地域:国家书目、联合目录和馆藏目录等; 按其媒体:卡片目录、书本目录、磁带目录和机读目录等。 目录检索系统数据库属参考数据库。 经常使用的目录有:馆藏目录、联合目录、机读目录等 3)文摘索引检索 文摘索引检索是一种参考型、相关性的检索,提供相关参考文献的线索,包括文献来源出处( source),也常带有文献的内容摘要,但不是文献原文。 EI、 SCI、 INSPEC等 文摘索引检索是能揭示到文章、论文级( articlelevel)的检索,这些文章大量的是来自期刊及会议论文集。 按其报道的学科范围:综合性和专业性检索工具; 按其取材范围:多种出版物类型和单一出版物类型工具; 按其著录方式:题录型和文摘型检索工具; 按其媒体:书本型、电子型检索工具等。 检索工具(数据库)的构成 第三节 检索语言和检索效果评价 • 检索语言 检索语言( retrieval language)概念 检索语言的分类 人工语言和自然语言 分类语言和主题语言 • 检索效果评价 检索效果( retrieval effectiveness) 查全率和查准率 提高检索质量的措施 检索语言的概念 语言是一种人们用以交流沟通的重要工具。 人与计算机对话,需要有计算机语言,人与检索系统对话来实施检索,则需要有检索语言( retrieval language)。 检索语言是用于描述检索系统中信息的内部及外部特征和表达用户信息提问的一种专门语言,检索的匹配正是通过语言的比较匹配来实现的。 检索语言也称索引语言,后者是从检索。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。