2012-12-04 64 views
0

是否可以使用SOLR或lucene索引駐留在Hadoop存儲上的數據?這些數據可以包含任何東西,包括pdf,doc,docx等。如何實現?我非常困惑。任何指導的幫助,高度讚賞:)Windows Azure solr和hadoop數據

回答

0

免責聲明:我沒有使用Azure上的Hadoop的經驗。

基本上,您可以使用以下code從HDFS檢索每個文件。

之後,您可以對此內容進行任何操作,例如在Lucene中編制索引。爲此,請按照以下內容link