2012-10-24 36 views
0

我創建一個PHP應用程序,允許用戶搜索使用Solr的供電搜索文件。這主要是因爲該應用需要搜索Word文檔和PDF的內容。該應用程序還使用MySql數據庫來跟蹤文件。Solr - 如何將元數據添加到通過Solr Cell索引的索引二進制文件?

我在想索引所有文件(可能在20,000左右)的最佳方法是編寫一個PHP腳本,它循環遍歷特定目錄中的所有文件,並將每個文件添加到Solr索引並創建一條記錄在我的數據庫中。

的問題是自身不包含所有需要被索引的數據文件。一旦使用Solr Cell對文件名,內容,作者等進行索引,我需要該應用的用戶能夠添加額外的元數據,如標籤和類別。

我明白,如果用戶是該數據添加到MySQL數據庫我不能再與額外的數據而不會覆蓋一個已經索引的數據更新Solr的(內容等)。

所以我的問題是,一旦一個文件已經被Solr的索引我怎麼能額外的元數據添加到不能由Solr的細胞提取從文件本身檢索索引?

+0

要做到這一點是指數時間:http://wiki.apache.org/solr/ExtractingRequestHandler#Literals – aitchnyu

回答