我準備做與lucence和Hadoop分發搜索模塊,但下跌困惑的東西分發搜索基礎:如何建立在Hadoop和Lucene
,因爲我們知道,HDFS是一個分發文件系統,當我把一個文件放到hdfs中時,文件將被分成嚴格的塊並存儲在clater中的不同的slave機器上,但是如果我使用lucene在hdfs上編寫索引,我想看看每臺機器上的索引,如何達到它呢?
我已經閱讀了一些hadoop/contrib/index和一些katta,但不理解「碎片,看起來像索引的一部分」的想法,它存儲在一臺計算機的本地磁盤上或只有一個方向分佈在集羣中?
感謝提前
請您重寫最後一句「集羣中只有一個方向分佈」嗎? – mschonaker