2009-02-17 52 views
10

在amazon.com上搜索一個術語,例如「堆棧溢出」,搜索結果會很快回來。Amazon如何面對搜索如此之快?

在窗口的左側,有一個分面搜索,它在某些類別中顯示與該詞匹配的產品計數。

然後,您可以鑽取這些條款。例如,有1094本書符合這個術語,它被分解爲計算機&因特網(1003),科學等等。

鑑於搜索書籍涵蓋了其中一些書籍的內容,它引起了我的注意這是一個非常令人印象深刻的壯舉。

亞馬遜如何做到這一點?大規模並行化?例如,每個節點都知道一些產品?

順便說一句,我看到了「堆棧溢出」出現在「新機器的靈魂」一文,一本書,我從1981年

回答

0

清楚地記得,有並行的,但每個人都做的事情之一在這些類型的東西的後端運行緩慢的過程(如書籍內容的語義解析)並在其上進行快速查找。他們實際上是在一些大型數據庫中緩存搜索結果,因此他們所要做的就是在搜索結果中查找數據庫。也許我誤解了這個問題,但它與Google所做的相似。當你輸入一個搜索詞時,你不認爲他們的蜘蛛會在網站上搜索你的網站,對吧?