我正在編寫自定義Elasticsearch標記器。該文檔僅指定了一個構造函數,用於傳遞讀取器以獲取要被標記的字符串,以及一個用於生成標記的incrementToken()方法。我可以看到沒有配置標記器的選項的跡象。我看到引用了Lucene TokenizerFactories,它們似乎提供了一個配置選項,但沒有看到它們在任何Elasticsearch上下文中提及。我的標記器是基本Tokenizer類的普通擴展:如何配置/初始化自定義Elasticsearch標記器
public class LCCNTokenizer extends Tokenizer {
private final CharTermAttribute termAtt = addAttribute(CharTermAttribute.class);
public LCCNTokenizer(Reader reader) {
}
@Override
public boolean incrementToken() throws IOException {
return false;
}
}
如何配置自定義Elasticsearch標記器?
你可以展示一些關於如何擴展基本Tokenizer類的內容嗎? – Val
不要猶豫,用這段代碼更新你的問題,它會更清晰。 – Val