ir-lab胡晓光(编辑修改稿)内容摘要:

e  Step5  ()  flushRamSegments()  SegmentInfos(_5,4) 信息检索实验室 增量算法  对于 N篇文档  N=1M, b=2 gives just 20 indexes  索引中包含的文档数很不均匀,大致等比数列  插入文档的速度较快,查询速度稍慢 信息检索实验室 归并算法  已知各个段内的 Term都是已排序的  用一个小根堆来表示存储各个段  堆中的顺序由段中当前第一个 Term决定  取出当前堆中最小的元素写入新的索引段  从最小元素所在的段中删除该元素  重新调整堆 信息检索实验室 归并算法  例子  为简单起见用一个整数来表示 Term  并且不含有相等的整数  Seg1: 1,4,5  Seg2: 2,9,10,12  Seg3: 3,6  Seg4: 7,8  Seg5: 11  合。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。