ir-lab胡晓光内容摘要:

BooleanQuery中的重要程度  例如 : 俄罗斯 恐怖 事件 信息检索实验室 BooleanQuery分值计算  计算查询的 querynorm  querynorm = boost / sqrt(∑i idfi*idfi*boosti*boosti)  计算每个查询的 Term和匹配文档的分值  weight = queryWeight * fieldWeight。  queryWeight = boost * idf * querynorm。  fieldWeight = tf * idf * fieldnorm。  对每篇匹配文档计算总得分  score = coord * (∑i weight i )  coord = 匹配词项数 /总词项数 信息检索实验室 BooleanQuery计算公式  整理可得计算公式如下  scorej = coordj*∑i(boost i*idf i*tfi,j*idf i*fieldnorm) / sqrt(∑i (idf i *idf i *boost i *boost i))  fieldnorm = fieldboost / sqrt(fieldlength)  其中 sqrt(∑i (idf i *idf i *boost i *boost i))和文档无关,不会影响文档的排名 信息检索实验室 Lu。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。