我正在使用Nutch 1.12與彈性搜索,我想動態地添加一個字段到NutchDocument
。動態添加字段到NutchDocument
目前,我可以將靜態字段值添加到NutchDocument
並能夠將其索引到Elastic Search。
這裏是我的索引過濾器的代碼片段:
public class CustomIndexFilter implements IndexingFilter {
private Configuration conf;
public Configuration getConf() {
return conf;
}
public void setConf(Configuration conf) {
this.conf = conf;
}
@Override
public NutchDocument filter(NutchDocument doc, Parse parse, Text url, CrawlDatum datum, Inlinks inlinks) {
String content = parse.getText();
doc.add("pageLength", content.length());
return doc;
}
}
我認爲NutchDocument
在解析後創建。所以,在此之前需要提供字段值(不知道我應該在哪裏提供)。爲此尋求解決方法。
任何幫助將不勝感激:)在索引步驟創建