2010-07-21 46 views
1

有人能解釋我文本搜索算法的工作原理嗎?我理解它是一個巨大的領域,但我試圖從高層次上理解它,以便我可以查找關於它的學術論文。例如,拼寫錯誤是一個難以解決的問題,當然Google解決了這個問題。當我搜索一個詞並在Google上拼寫時,它會自動提示拼寫正確。索引是如何完成的?使用MapReduce我可以看到他們索引各種實體。他們或其他人是如何索引和存儲的?可能是我正在尋找一個MapReduce的實際實現,如果我正在朝着正確的方向思考。關於實現的文本搜索問題

  • 帕烏

回答

0

恐怕這個問題實在太大,這可能解釋了爲什麼它沒有看到一個答案。就Google的拼寫檢查而言,Peter Norvig解釋了它是如何完成的:How to Write a Spelling Corrector

谷歌在生產用途中的確切實現肯定看起來有點不同,方式也更復雜,但這可能會讓你開始。