1
我想用索爾做一個網絡搜索應用程序,但我遇到了問題。問題是,在我遵循的例子中,所有文件都在同一個文件夾中。但我想索引不同目錄中的文件(即給所有子目錄中的根文件夾和索引所有xml文件)。那可能嗎?來自多個文件夾的索引索引
我想用索爾做一個網絡搜索應用程序,但我遇到了問題。問題是,在我遵循的例子中,所有文件都在同一個文件夾中。但我想索引不同目錄中的文件(即給所有子目錄中的根文件夾和索引所有xml文件)。那可能嗎?來自多個文件夾的索引索引
試試這個在shell腳本(未經測試):
#!/bin/sh
FILES=$(find . -iname "*.xml")
URL=http://localhost:8983/solr/update
for f in $FILES; do
echo "Posting $f"
curl $URL --data-binary @$f -H 'Content-type:application/xml'
echo
done
#send the commit command to make sure all the changes are flushed and visible
curl $URL --data-binary '<commit/>' -H 'Content-type:application/xml'
echo
將它放在根目錄下,你必須在XML文件。
(我假設你有Linux的和「post.sh」劇本是你遵循的例子)
嘗試SimplePostTool遞歸選項:
java -Dauto -Drecursive -jar post.jar
你可以很容易地修改腳本(post.sh ,如果你正在使用它)迭代和索引目錄及其所有子目錄中的文件。 – Jayendra 2012-04-10 08:58:55
謝謝。你能不能更具體一些,因爲我不知道如何做到這一點?我應該使用CD嗎? – Anastasia 2012-04-10 10:38:06
用您最喜歡的編程語言:**(1)**遞歸遍歷所有目錄**(2)**使用HTTP客戶端庫(例如:用於python的urllib2,用於shell的curl,用於C的libcurl)將文檔上傳到solr 。 – aitchnyu 2012-04-10 13:09:45