文摘 基于修改频率项权重信息检索的方法 作者(年代):m . Santhanakumar和c·克里斯托弗·哥伦布 术语frequency-inverse文档频率(TF-IDF)是一种反复使用术语权重方法,分配权重基于文档中出现的一个术语。本文提出了一种改进的TF-IDF使用多词在文档中出现的方法。为了达到最佳性能,标记等预处理方法,应用stopword删除和阻止用户查询和文档。拟议的工作比较实验结果与现有的术语权重方法如TF、IDF、TF-IDF和熵。该方法提供了更好的平均精度,召回和f值值比现有的方法。 PDF 分享这