tianwanginwebtrackofsewm20xx内容摘要:

综合外部知识 (网站目录 )  名字  Phrase/proximity 内容提纲  问题与分析  设计与实现  未来的工作 步骤  网站目录数据收集  选取 sohu网站目录做为外部知识库 ,建立网站目录数据库。  CWT100g数据预处理  链接分析,提取出 anchor text,建立 anchortext数据库  链接分析,计算 pagernak  页面分析和中文分词 包括 web page的正文,对应的anchortxt和网站目录数据。  建立倒排索引  带位置数据的全文索引  调整排序算法参数,提交结果  调整排序算法中各个因素的比例参数 TDRUN1  基准的检索系统作为 baseline  排序算法使用分级策略  IR weight。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。