非网页数字资源分类内容摘要:

名字 (1) 名字的特点 资源的名字都是专有的 ,资源名字 ,文件名字 ,路径名都太短 ,信息不足 ,难以利用 两个类别相同的资源 , 其名字之间并没有太大的共性 ,但其 上下文 环境应该大体相似 名字上下文 获取上下文 , 分析同类资源的共性和不同类资源的差异 资源名字和文件名字 (2) 名字上下文的获取 名字上下文 : 使用名字作为 关键字 在百度中搜索得到的一条结果称为一个名字上下文 (只是利用了百度的搜索结果页面 , 而没有去爬取结果对应的页面 )。 关键字的选择 首选完整的资源名 ,若失败 则使用净化处理后的资源名 (比如 ,存在书名号的 ,只保留书名号之内的文字。 若名字中有中英文 ,则其中的英文字符去掉等 ), 若失败则使用随机的一个文件名 , 若仍失败 打印错误报告 , 退出。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。