2011-10-18 85 views
0

我使用的是Lucene.NET,當我嘗試索引下面的文本時:例如,Lucene.NET索引單字母單詞?

這是關於大膽的文本,所有的東西都索引很好,但一個T將被忽略。

有人知道這個問題。我正在使用以下語法。

doc.Add(new Field("text", text, Field.Store.NO, Field.Index.TOKENIZED)); 
+0

顯示更多的代碼。 –

回答

0

「T」在默認情況下是標準分析儀中的停用詞。創建分析儀時,您可以提供自己的停用詞列表。

就產生一個分析儀是這樣的:

StandardAnalyzer standardAnalyzer = new StandardAnalyzer(new string[]{"an", "a", /*other stopwords*/}); 

和索引和搜索過程中使用它。

+0

我使用StandardAnalyzer,並使用工具Luke檢查T是否在索引中。我做了一個確切的詞組合搜索「categorie T」,沒有發現任何東西。 – wsplinter

+0

@wsplinter,請檢查上面的解決方案。 – Dmitriy

+0

沒有'T'不是一個停止詞。 –