0
我不知道什麼是對的PDF文件的文件夾上傳到Solr的索引一個最好的方法?
現在,我正在做的是生成一個文件列表,併爲每個文件我發起一個請求索引索引,但它似乎浪費了很多重載,所以我想知道如果我可以使用一個請求上傳所有這些文件?
感謝
我不知道什麼是對的PDF文件的文件夾上傳到Solr的索引一個最好的方法?
現在,我正在做的是生成一個文件列表,併爲每個文件我發起一個請求索引索引,但它似乎浪費了很多重載,所以我想知道如果我可以使用一個請求上傳所有這些文件?
感謝
如果你擔心性能,最好的辦法是在您的客戶端運行Apache提卡,只是發送最終提取的內容文件到Solr。這是最有效的方法,然後你可以批量提取多個提取。
Solr提取代碼只是在蓋下運行Tika。
感謝您的幫助。我沒有觸及關於Tika的任何部分,但無論如何,假設在Tika完成提取後,上傳這些提取的文檔的最佳方法是什麼? – Kuan
使用類似SolrJ的語言與Java客戶端的Solr對話。 –
感謝您的幫助。另一個問題是:http://stackoverflow.com/questions/27806002/how-to-upload-pdf-and-update-field-within-one-request-in-solr – Kuan