招聘信息中知识需求挖掘研究毕业论文(编辑修改稿)内容摘要:

完全符合国际最先进的人力资源引进机制。 ( 四 ) 人才储备对企业的影响 招聘实践中,常会发现一些条件不错且适合企业需要的人才,因为岗位编制,企业阶段发展计划等因素限制无法现时录用,但企业很可能在将来 某个时候需要这方面的人才。 这个时候,企业人力资源不要轻易就与这些人才擦肩而过,。 需要将这类人才的信息纳入企业的人才信息库(包括个人资料、面试小组意见、评价等),不定期地与之保持联系,一旦将来出现岗位空缺或企业发展需要,即可招入麾下,既提高了招聘速度也降低了招聘成本。 13 (五)双向选择原则 要 树立“双向选择”的现代人才流动观念,与应聘者特别是重点应聘者平等地、客观地交流,看彼此是否真正合适。 在对企业现有人员进行员工分类时,会发现对于意向不是非常强烈的员工,其会有惰性并缺乏主动性,如果企业不能针对这类员工进行 相应的激励的话,那么这类员工将增大企业人力资源自然减 员的幅度,这也将大大的浪费企业的财力和精力。 在进行高效的招聘时,企业 不能为了喜迎应聘者,故意美化、夸大企业,对企业存在的问题避而不谈,以至于应聘者过分相信招聘企业的宣传而对企业满怀期望。 一旦人才进入企业,发现企业实际上并没有原先设想的那样好,就会产生失落,上当受 骗的感觉,挫伤工作积极性。 因此,企业在招聘中一定要强调双向选择。 三 就业知识需求关系构建的具体实现 (一) 数据源选取 数据源选取的标准是以较小的资源耗费,帮助用户获得更高的查询质量。 选取质量较 高的数据源能够尽可能降低网络数据集成中后续集成工作的难度,所以我们选取与目标相关的文档集作为信息源,以降低信息处理量。 在本文中,选取的网络文本数据源主要包含三类,一类为专业招聘网站上招聘信息;一类是企业官方网站上的招聘信息,;还有一类为专业博客社区中的博客。 14 首先是专业招聘网站。 在我国招聘网站主要有两种模式:中介平台地位的传统招聘模式以及近年来新兴的依托商务社交的社交招聘模式,对招聘网站的细分如表1所示。 一级分类 二级分类 举例 中介平台地位的传统招聘网站 综合性的招聘网站 智联招聘、前程无忧、中华英 才网 垂直细分的招聘网站 上海招聘网、南方人才网、世贸人才网 致力于招聘服务某些特定环节的招聘网站 Meijob、职友集 商务社交式的社交招聘网站 综合社交类招聘网站 微博招聘 专业社交招聘网站 大街网、天际网 表一 我国 聘网站的分类 艾瑞咨询《 2020年第三季度中国网络招聘行业发展报告》显示,2020年 9 月至 2020年 9 月中国招聘网站日均覆盖人数 Top5 分别是:智联招聘、前程无忧、应届毕业生求职网、应届生求职网和中华英才网,智联招聘的日均覆盖人数约为 200万人。 2020年 9月至 2020年9 月中国核心社交招聘网站日均覆盖人数 Top5中,大街网遥遥领先于其他网站,日均覆盖人数约为 60 万人 [8]。 本文采集的招聘信类的网络文本主要以中介平台地位的传统招聘网站为主,辅助以商务社交式的社交招聘网站。 前者是国内网络招聘的主要形式,且更专注于职业招聘,可满足不同行业、不同专业人群的需求,挖掘价值很高; 15 后者现阶段在国内使用率不高,对岗位的描述和人才的定位并不明晰,挖掘难度也较大。 再就是企业官方网站。 目前,越来越多的企业都拥有自己的官方网站。 企业官方网站上的招聘信息更具 有针对性,所罗列的岗位、岗位职责和岗位要求也更详细准确,是求职者获取就业信息的一个重要渠道,如百度的招聘网站,不过,并不是所有的企业都已经开发自己的官方网站,或者并没用把招聘信息放到网站上。 因此,我们把企业官方网站上的招聘信息作为辅助数据源。 最后为专业博客社区。 在博客社区中,博客作者会记录许多作者的生活、学习、工作的点点滴滴,内容比较广泛。 但是有一种专业型博客,如 ITEYE、 CSDN等,原创博客作者撰写的博客大多与自身任职的岗位相关,在其博客中会不由自主地涉及到许多与其岗位相关的知识点。 而且往往在 博客中,都会有社会化标签,用于标注博客所涉及的知识点。 因此,可以通过抓取专业博客中的网络文本,提取出岗位与知识点的关系。 此外,专业博客中标注的社会化标签还可以用于构建分词词典。 (二) 网络文本分析 当网络文本的数据源确定以后,即可根据数据源的特点,编写抓取网络文本的爬虫,接着抓取网络文本,保存到网络文档集中。 由于目前网络文本是非结构化的,而且除了包含有用信息,还含有大量噪音信息,如广告、图片动画、与主题无关的超级链接、脚本 16 语言代码和其他各种标签。 此外,与传统的文本文档相比,网络文本在语义的内聚性上难 以得到保证,一个网络页面中往往包含多个语义无关的部分 [9]。 如果提取的网页文本中包含大量的噪音信息,对于后期中文分词的效率以及关系提取的效果会有很大的影响。 因此需要针对网络文本的结构,借助网页文本分析工具包来解析网络文本,并提取出网络文本中适于进行本文文本挖掘的结构化文本。 目前的网页文本解析器有很多,包括 jsoup、 Gumbo,PHP Simple HTML DOM Parser 等,选择其中一种即可。 (三) 关系提取 以离散的形式存在的词集并不能反映出专业、岗位和知识点三者之间的关系,因此,需要对该分词词 集进行关系提取。 语词标注 的方式: 根据预先构建的词典,即专业词典、岗位词典和知识点词典对词集中的词进行标注,根据每一个词所在的词典,即可判定出该词的词类为专业、岗位和知识点三项的哪一项。 例如,假设某一文本的分词结果集中,出现了“移动云计算”这个词,这个时候根据专业词典库,可以标注其为“专业”。 关系构建 的方式: 对每一个网络文本中出现的专业类词、岗位类词和知识点类词,基于共现原理分别建立关系。 例如,假设某一网络文本中,出现了专业“云计算”,还出现 了岗位“云计算测试工程师”和“云计算研发工程师”,那么就将专业“云计算”与岗位“云计算测试工程师”和“云计算研发工程师”分别建立关系,同时,又 17 出现了知识点“ Linux操作系统”,这时,也分别将岗位“云计算测试工程师”和“云计算研发工程师”与知识点“ MySQL ”建立关系。 关系合并的方式: 当关系建立完毕后,即可对所有关系(专业与岗位的关系,岗位与知识点的关系)进行合并,并可以借助关联规则,获取每个关系的强度。 四 网络简历样本的获取与预处理 (一) 简历样本的获取 本文从某人才招聘网站数据库获得简历数据 ,选取十个热门的岗位 (会计、销售工程师、卫生医疗、纺织服装设计、司机、建筑 /结构工程师管理人员、美术 /图形设计、市场经理、行政 /人事人员 ),每个岗位中抽取 50个招聘职位 ,每个职位抽取 20份简历信息 ,每一份简历及其相应的招聘职位要求构成一个样本。 其中 10 份为企业通过招聘网站发出面试通知的简历 (简称 A类样本 ),另外 10份为没有被企业通知面试的简历 (简称 B 类样本 )。 (二) 简历样本的预处理 考虑到本研究的挖掘目的 ,本文选取了以下几个应聘者的属性与招聘公司的需求进行匹配 ,在对数据进行处理后 ,再应用到数据挖掘工作中。 所选择的属性都需要将招聘企业的要求和应聘者的信息相匹配 ,再进行数据的处理。 选择的输入属性是 :性别、年龄、籍贯、学历、 18 婚姻状况、工作年限、政治面貌、毕业院校、计算机水平、专业、工作经验 ,输出属性是 :是否被接受面试。 由于原始数据库中的数据存在着各种各样现实中不可避免的缺陷 ,下面将根据所选择的属性分别详述对简历数据所进行的预处理。 (1)性别 (R_Sex):不需要复杂的处理。 (2)年龄 (R_Age):本文将应聘者划分为三个年龄段 :三十岁。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。