2012-04-14 67 views
0

我寫了一個自定義分析器,用一個長度來包裝StandardAnalyzer。現在我想過濾掉所有包含數字的條款。 實施這個的最佳方式是什麼?如何在Lucene中從TokenStream中刪除數字?

+0

它只在一個領域?如果是這樣,您可以使用FieldBridge不向文檔添加僅包含數字的條款。 – robertvoliva 2012-04-14 03:21:46

+0

什麼是Lucene中的FieldBridge? – 2012-04-14 04:20:18

回答

1

您可能會在自定義TokenFilter。看看那裏最簡單的過濾器之一LowerCaseFilter。我認爲你會發現很容易寫出你自己的這些線。

0

您可以使用PatternReplaceFilter通過使用正則表達式來檢測並從TokenStream中刪除數字。