tianwanginwebtrackofsewm20xx内容摘要:
综合外部知识 (网站目录 ) 名字 Phrase/proximity 内容提纲 问题与分析 设计与实现 未来的工作 步骤 网站目录数据收集 选取 sohu网站目录做为外部知识库 ,建立网站目录数据库。 CWT100g数据预处理 链接分析,提取出 anchor text,建立 anchortext数据库 链接分析,计算 pagernak 页面分析和中文分词 包括 web page的正文,对应的anchortxt和网站目录数据。 建立倒排索引 带位置数据的全文索引 调整排序算法参数,提交结果 调整排序算法中各个因素的比例参数 TDRUN1 基准的检索系统作为 baseline 排序算法使用分级策略 IR weight。tianwanginwebtrackofsewm20xx
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。