计算机检索理论基础(药学文献检索)内容摘要:
计算机检索理论基础(药学文献检索) 第二章计算机检索理论基础计算机检索定义简称机检,指利用计算机查找文献信息的过程。 原理计算机将输入机检系统的检索提问特征标识(检索词)或用布尔逻辑运算符( 结起来的检索提问式与已存储在系统中的文献特征标识(标引词如:主题词、分类号和类目名称等)进行机械性匹配比较,凡符合给定的比较原则和逻辑运算条件者即为命中文献。 优点: 速度快,效率高( 检索途径多(除了主题、著者、分类外,还有出版年、著者单位、文献类型、特征词等); 用户界面友好,使用方便(可对任意个检索词进行逻辑组配,并且进行自动扩检); 资源更新快(网上资源可以每日更新); 直接输出检索结果(打印或拷贝); 信息内容的广泛、访问快速且搜索具有网络性。 中国学术期刊网缺点:检索费用较高;缺乏思维能力和灵活性;文献回溯检索能力不强;网上检索,线路紧张时速度慢。 一、计算机信息检索的发展历程脱机检索 阶段联机检索阶段光盘检索阶段网络化检索阶段脱机检索阶段 ( 时间: 20世纪 50年代 60年代 1954年,美国海军军械实验站图书馆研制出计算机信息检索试验系统。 检索人员 检索策略 成批检索 用户不足:地理上的障碍;时间上的迟滞;封闭式的检索联机检索阶段( 时间: 20世纪 60年代 80年代 1964年,美国医学图书馆开始了 计算机信息检索进入了新的历史发展阶段。 用户 > 检索策略 >人机对话” > 获取所需信息 著名的国际联机检索系统有美国的 有欧洲的 国的机检索 (联机检索的优缺点 优点检索速度快,效率高;检索范围广泛、全面;检索途径多,方便、灵活;检索内容新,实时性强;检索辅助功能完善(人机对话、检索结果输出方式灵活,输出格式多样等)。 缺点检索费用高;对检索系统及其文档(数据库)的收录、标引、特点等问题较难了解、熟悉;检索技术和技巧不易掌握。 光盘检索阶段 时间: 20世纪 80年代以来 1985年,美国研制出第一个推向市场的光盘产品据库及其编目软件系统,它收藏了美国国会图书馆自 1965年以来的全部英语文献书目,以及 19001964年的部分书目记录。 1986年,我国国家海洋局海洋科技情报研究所首次引进光盘数据库 科学与渔业文摘 )。 储量极大而体积微小,要求设备简单,可随地安装,使用方便、易于操作,检索费用低(不需要昂贵的联机检索通讯费用),可随时修改检索策略而具有很高的查全率和查准率等优点。 单机光盘检索 联机光盘检索 光盘库( 2达 500光盘) /光盘塔( 8络化检索阶段 时间: 20世纪 60年代, 90年代以来 1972年, 后又加入 后, 而使信息检索进入到网络检索阶段。 联结了一百多个国家、几万个信息网络、几百万台主机、几千万个终端用户,并能够跨越时空,进行实时信息检索、资源共享的国际性超级计算机网络。 目前, 90%的国际联机检索系统都已进入 界上许多国家(包括中国)都从 二、 截词 、位置算符 、 字段检索等。 布尔逻辑( 配 是现行计算机检索的基本技术,主要通过“ 和( ) ” 、 “ 或( ) ” 、“ 非( -) ” 等将检索词联络起来,常见运算次序是() 词 ( 用截词符号 “。 ” 、 “ *” 、 “ $加再检索词的前后和中间 , 以检索一组概念相关或词根相同的词。 后截断可检 的单复数 , 代检索 , 199。 ;词 根 检 索 , 可检 0多个词汇。 有限截断和无限截断截词 (前截断*检 用很少。 中截断检 找英美不同拼法最有效。 用 ?作为截词符 , 主要有:。 n A(W)B G:)A( W)A(S)B EG:A(N)B 可颠倒顺序EG:)of A( N)of of 段检索即指定检索词出现的字段,包括前缀限制符和后缀限制符。 常用前缀限制符: T、 缀限制符将字段代码放在检索词后。 )B 算机检索基本程序 其一般流程是:分析课题选择数据库 列出检索词 设计检索提问式 上机检索 不满意 (1)弄清用户信息需求的目的和意图。 (2)分析课题涉及的学科范围、主题要求。 分析课题的内容实质 ;析出误假主题概念 ;析出被隐匿的主题概念 ; (3)课题所需信息的内容及其特征。 (4)课题所需信息的类型,包括文献类型、出版类型、年代范围、语种、著者、机构等。 (5)课题对查新、查准、查全的指标要求。 (1) 数据库收录的信息内容所涉及的学科范围 ; 收录文献的来源、学科特点 (2) 数据库收录的文献类型、数量、时间范围以及更新周期; (3) 数据库所提供的检索途径、检索功能和服务方式。 (1) 先选用主题词。 当所选的数据库具有规范化词表时,应优先选用该数据库词表中与检索课题相关的规范化主题词,从而可获得最佳的检索效果。 注意上位、下位,关键词:注意同义词、近义词、英美不同拼法和禁用词 (2) 选用数据库规定的代码。 许多数据库的文档中使用各种代码来表示各种主题范畴 ,有很高的匹配性。 例如,世界专利文摘数据库中的分类代码,化学文摘数据库中的化学物质登记号。 (3) 选用常用的专业术语。 在数据库没有专用的词表或词表中没有可选的词时,可以从一些已有的相关专业文献中选择常用的专业术语作为检索词。 (4) 选用同义词与相关词。 同义词、近义词、相关词、缩写词、词形变化等应尽量选全,以提高查全率。 构建检索提问式时,应正确运用逻辑组配运算符: (1)使用逻辑“与”算符可以缩小命中范围,起到缩检的作用,得到的检索结果专指性强,查准率也就高。 (2)使用逻辑“或”算符可以扩大命中范围,得到更多的检索结果,起到扩检的作用,查全率也就高。 (3)使用“非”算符可以缩小命中范围,得到更切题的检索效果,也可以提高查准率,但是使用时要慎重,以免把一些相关信息漏掉。 另外,在构建检索提问式时,还要注意位置算符、截词符等的使用方法,及各个检索项的限定要求及输入次序等。 整检索策略 1)检索结果信息量过多 产生检索结果信息量过多的原因可能有以下两点:一是主题词本身的多义性导致误检;二是对所选的检索词的截词截得太短。 在这种情况下,就要考虑缩小检索范围,提高检索结果的查准率。 调整检索策略的方法如下: (1)减少同义词与同族相关词; (2)增加限制概念,采用逻辑“与”连接检索词; (3)使用字段限定,将检索词限定在某个或某些字段范围; (4)使用逻辑”非”算符,排除无关概念; (5)调整位置算符,由松变严, (F) (W)。 2)检索结果信息量过少 造成检索结果信息量少的原因有以下几点:首先,选用了不规范的主题词或某些产品的俗称,商品名称作为检索词;其二,同义词、相关词、近义词没有运用全;其三,上位概念或下位概念没有完整运用。 针对这种情况,就要考虑扩大检索范围,提高检索结果的 查全率。 调整检索策略的方法如下: (1)选全同义词与相关词并用逻辑”或”将它们连接起来,增加网罗度; (2)减少逻辑“与”的运算,丢掉一些次要的或者太专指的概念; (3)去除某些字段限制; (4)调整位置算符,由严变松, (W) (F)。 据检索系统提供的检索结果输出格式,选择需要的记录以及相应的字段 (全部字段或部分字段 ),将结果显示在显示器屏幕上、存储到磁盘或直接打印输出,网络数据库检索系统还提供电子邮件发送,至此,完成整个检索过程。 思考题计算机信息检索经历了哪几个发展阶段。 掌握布尔逻辑组配、截词、位置算符、字段检索等检索技术。 图书馆及其文献系统 3个图书馆楼95职工7个借书点19个阅览室173万册图书 运转状况( 2003)读者群:约 14000借还书 110万册次外文数据库全文文章下载量 108万篇网站信息流量 100电子图书 阅读: 30天 图书馆主页。计算机检索理论基础(药学文献检索)
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。