2012-04-10 69 views
1

我想用索爾做一個網絡搜索應用程序,但我遇到了問題。問題是,在我遵循的例子中,所有文件都在同一個文件夾中。但我想索引不同目錄中的文件(即給所有子目錄中的根文件夾和索引所有xml文件)。那可能嗎?來自多個文件夾的索引索引

+1

你可以很容易地修改腳本(post.sh ,如果你正在使用它)迭代和索引目錄及其所有子目錄中的文件。 – Jayendra 2012-04-10 08:58:55

+0

謝謝。你能不能更具體一些,因爲我不知道如何做到這一點?我應該使用CD嗎? – Anastasia 2012-04-10 10:38:06

+0

用您最喜歡的編程語言:**(1)**遞歸遍歷所有目錄**(2)**使用HTTP客戶端庫(例如:用於python的urllib2,用於shell的curl,用於C的libcurl)將文檔上傳到solr 。 – aitchnyu 2012-04-10 13:09:45

回答

0

試試這個在shell腳本(未經測試):

#!/bin/sh 

FILES=$(find . -iname "*.xml") 
URL=http://localhost:8983/solr/update 

for f in $FILES; do 
    echo "Posting $f" 
    curl $URL --data-binary @$f -H 'Content-type:application/xml' 
    echo 
done 

#send the commit command to make sure all the changes are flushed and visible 
curl $URL --data-binary '<commit/>' -H 'Content-type:application/xml' 
echo 

將它放在根目錄下,你必須在XML文件。

(我假設你有Linux的和「post.sh」劇本是你遵循的例子)

0

嘗試SimplePostTool遞歸選項:

java -Dauto -Drecursive -jar post.jar