ir-lab胡晓光内容摘要:
BooleanQuery中的重要程度 例如 : 俄罗斯 恐怖 事件 信息检索实验室 BooleanQuery分值计算 计算查询的 querynorm querynorm = boost / sqrt(∑i idfi*idfi*boosti*boosti) 计算每个查询的 Term和匹配文档的分值 weight = queryWeight * fieldWeight。 queryWeight = boost * idf * querynorm。 fieldWeight = tf * idf * fieldnorm。 对每篇匹配文档计算总得分 score = coord * (∑i weight i ) coord = 匹配词项数 /总词项数 信息检索实验室 BooleanQuery计算公式 整理可得计算公式如下 scorej = coordj*∑i(boost i*idf i*tfi,j*idf i*fieldnorm) / sqrt(∑i (idf i *idf i *boost i *boost i)) fieldnorm = fieldboost / sqrt(fieldlength) 其中 sqrt(∑i (idf i *idf i *boost i *boost i))和文档无关,不会影响文档的排名 信息检索实验室 Lu。ir-lab胡晓光
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。