0
我寫了一個自定義分析器,用一個長度來包裝StandardAnalyzer。現在我想過濾掉所有包含數字的條款。 實施這個的最佳方式是什麼?如何在Lucene中從TokenStream中刪除數字?
我寫了一個自定義分析器,用一個長度來包裝StandardAnalyzer。現在我想過濾掉所有包含數字的條款。 實施這個的最佳方式是什麼?如何在Lucene中從TokenStream中刪除數字?
您可能會在自定義TokenFilter
。看看那裏最簡單的過濾器之一LowerCaseFilter。我認爲你會發現很容易寫出你自己的這些線。
您可以使用PatternReplaceFilter通過使用正則表達式來檢測並從TokenStream中刪除數字。
它只在一個領域?如果是這樣,您可以使用FieldBridge不向文檔添加僅包含數字的條款。 – robertvoliva 2012-04-14 03:21:46
什麼是Lucene中的FieldBridge? – 2012-04-14 04:20:18