開箱所述的nutch索引作家elasticsearch的生成elasticsearch與的nutch-site.xml中提供的名稱在屬性元素的索引(或Nutch的-default.xml中):如何修改nutch索引編寫器用於elasticsearch的索引模板?
<property>
<name>elastic.index</name>
<value>nutch</value>
<description>Default index to send documents to.</description>
</property>
的映射部在elasticsearch這樣一個自動生成的索引始終具有以下結構
{
"nutch": {
"mappings": {
"doc": {
"properties": {
"anchor": {
"type": "string"
},
"boost": {
"type": "string"
},
"cache": {
"type": "string"
},
"content": {
"type": "string"
},
"contentLength": {
"type": "string"
},
"date": {
"type": "date",
"format": "dateOptionalTime"
},
"digest": {
"type": "string"
},
"host": {
"type": "string"
},
"id": {
"type": "string"
},
"lang": {
"type": "string"
},
"lastModified": {
"type": "date",
"format": "dateOptionalTime"
},
"segment": {
"type": "string"
},
"title": {
"type": "string"
},
"tstamp": {
"type": "date",
"format": "dateOptionalTime"
},
"type": {
"type": "string"
},
"url": {
"type": "string"
}
}
}
}
}
}
- 哪裏模板嗎?
- 可以更改嗎?
- 如果是,哪些字段是強制性的,哪些是可選的?
- 我在哪裏可以找到關於此的更多信息?
任何幫助表示讚賞! 謝謝,Wolfram
事實上,我首先經歷了索引編寫器的源代碼 - 正如你所說的,沒有引用模板。我想我錯過了你提到的(在他們的wiki中)由Nutch索引/存儲的字段列表。因此,也取決於您在nutch-site.xml中的插件列表中啓用的內容,nutch索引編寫器將基於這樣的字段列表生成elasticsearch映射。通過檢查生成的映射,人們還可以得出哪些插件成功啓用(或不啓用)。然後可以像我一樣在彈性搜索中找到所得映射。對? – wbartussek
是的,沒錯! – Val
到目前爲止,你有沒有嘗試過這樣的運氣? – Val