词频
基于特征域词频的邮件过滤方法的研究
基于特征域词频的邮件过滤方法的研究 特征词典的构建 : x2(t,c)综合比较了词条对某一个类别的贡献和对其余类别的贡献。 其中 , 如果 ADCB0, 说明该词和类别正相关 ,即词条出现说明某个类别也可能出现;反之 , 如果 ADCB0, 说明该词和类别负相关 , 即词条出现说明某个类别很可能不会出现。 因此在特征选择时 , 要选择 x2(t,c)值高并且同时满足