2011-03-14 64 views
7

如何在'。'上標記Lucene標準分析器的標記。炭? 例如,在查詢「B」時,我需要它返回「A.B.C」中的B作爲結果。我需要像標準分析儀那樣對待數字,因此簡單分析儀是不夠的。 如果我可以指定標準分析器對'。'進行標記,那將是完美的。字符也是。如果我只用這個小擴展名寫自己的tokenizer,我該怎麼辦呢? 謝謝, nachaLucene標準分析儀在時間段上分割

回答

1

我相信最簡單的是創建自己的分析儀。這將從StandardAnalyzer獲取令牌作爲輸入,並進一步分割點上的令牌,從而保持無痕令牌不受影響。

The package summary給出了一些關於如何做到這一點的建議。 This blog post似乎非常相關,但使用舊版本的Lucene,所以你可能需要調整它。另請參閱Lucene FAQ

+0

謝謝,如果我正在編寫我自己的過濾器,過濾標準分析器結果令牌流,分裂那些包含'。'的令牌,我將如何去呢?據我所見,過濾器被用來跳過令牌,而不是將一個令牌分解成2個令牌。 – Nacha 2011-03-15 05:53:11