我正在使用此項目:https://github.com/lucidworks/hadoop-solr 有誰知道在哪個值中保存了正在處理的文檔的名稱(或路徑)。我想將此值檢索到Solr Admin(將其名稱添加到我的模式中)。這可能嗎?「Hadoop-Solr Lucidworks Project」檢索輸入名稱路徑
示例:我希望能夠看到文檔的名稱,從中查詢返回相同的結果。
我運行此命令的項目:
hadoop jar solr-hadoop-job-2.2.5.jar
com.lucidworks.hadoop.ingest.IngestJob
-Dlww.commit.on.close=true -DcsvDelimiter=
-cls com.lucidworks.hadoop.ingest.CSVIngestMapper -c spyros1
- i /usr/local/hadoop/input
-of com.lucidworks.hadoop.io.LWMapRedOutputFormat
-s http://127.0.1.1:8983/solr
那麼有什麼方法可以檢索結果所屬文檔的名稱或路徑嗎?如果我使用2個txt文檔,我應該從哪個txt中知道結果來自哪裏。是否可用於其他Ingest Mapper? @acesar –
>適用於其他Ingest Mapper? 是的,RegexIngestMapper/GrokIngestMapper添加一個名爲path的字段。但是我不完全確定我是否遵循你的用例。 – acesar
我正在使用「data_driven_schema_configs」作爲我的收藏。該字段必須添加到data_driven_schema_configs的managed-schema中? @acesar –