2011-01-19 18 views

回答

1

如果在您的系統中使用IDF,您可能不想使用IDF,但您不想重複比常用術語更重的罕見術語。而且,計算idf是一項代價高昂的操作。這從以下事實可以明顯看出:在最常用的評分方案中,即lnc.ltc,我們不計算文檔中出現的術語的idf分數。此外,如果您的搜索引擎只處理一個單詞查詢,那麼使用idf就好像每個文檔都是一樣的。希望它有幫助