3

很容易理解如何使用map-reduce來收集文本並構建大型倒排索引。但是如何將map-reduce用於倒排索引搜索呢?如何在倒排索引搜索中使用map-reduce?

+0

你是基於什麼問題?我的意思是,你怎麼知道它被用於搜索? AFAIK,搜索通常是單線程的,並且相對便宜。雖然,我可能是錯的......:| – amit

+0

我認爲標籤「算法」和「信息檢索」更好,所以我重申了。如果你認爲我錯了 - 回滾或重新編輯。 – amit

+0

通過mapreduce構建索引的概念很容易理解。但是基於我的搜索,真的很難找到一些很好的參考來教導人們如何去做。我聽說Solr支持mapreduce構建索引,但沒有文檔或代碼顯示它。我正在努力實現這一點,你能否提供一些關於如何實現它的參考? – hakunami

回答

4

建立一個大的倒排索引,沒錯。但不適合搜索。 MapReduce是批處理。

我很確定你不想等到MapReduce作業在2 mio上運行。項目並對它們進行評分,然後再有一個Job需要運行並對分數進行降序排序。

但這只是Hadoop的情況。也許如果你在MongoDB中使用MapReduce,這可能是準確的。但仍有很多開銷。

0

據我所知,MapReduce主要用於批處理,而不是搜索,這對響應時間有較高的要求。