我對lucene非常陌生。我有一個文本文件,其中包含100行記錄,每行包含兩列。第一列是用戶標識,第二列是url_list(我想這些將是我的文檔字段)java lucene索引和搜索每行創建一個文檔的示例代碼
我需要提供一個使用lucene的搜索功能,它將給包含輸入的url或userid的文檔。爲此,我需要爲每行文本文件創建一個lucene文檔。
請建議我該一些示例代碼..
我米使用Lucene版本3.6.2
我對lucene非常陌生。我有一個文本文件,其中包含100行記錄,每行包含兩列。第一列是用戶標識,第二列是url_list(我想這些將是我的文檔字段)java lucene索引和搜索每行創建一個文檔的示例代碼
我需要提供一個使用lucene的搜索功能,它將給包含輸入的url或userid的文檔。爲此,我需要爲每行文本文件創建一個lucene文檔。
請建議我該一些示例代碼..
我米使用Lucene版本3.6.2
這裏是Lucene的一個短暫而奇妙的教程初學者。
步驟
1)我認爲你是預解析的文本文件,以獲得用戶ID的舉行,相應的URL列表。你必須這樣做。 Lucene不會幫助。 Lucene不會破壞屬於單個字段的文本,但不會破壞文本並將用戶標識添加到用戶標識字段和網址字段中。
2)閱讀上面的教程。我強烈建議你使用目前爲4.1的Lucene的latest version。
3)請注意以下事項特定於您的使用情況
對每個文檔兩個字段:USER_ID,URL(當然你可以改變這些名字)
不要ANALYZE(分解爲令牌)USER_ID字段的內容。
我不知道如何存儲URL字段。您可能不希望對其進行分析或使用可識別URL而無需標記的StandardAnalyzer。
4)您可以在本教程中找到用於索引,查詢,搜索和檢索結果的示例代碼。
嗨,感謝您的幫助..但我沒有得到任何源代碼創建每行1個文件..我應該用什麼?另外我有一個文本文件,如 - > useripaddress url ...我只需要爲這樣的行創建和索引文檔。 – sm21 2013-03-07 05:30:50
你的意思是解析你的文本文件?這不屬於Lucene ..代碼可以寫成只有你可以提供你在該文件中的文本樣本,並清楚地解釋你希望它被索引的方式。 – phani 2013-03-07 14:00:11