我正在測試Lucene.NET以滿足我們的搜索需求,並且我有幾個問題。按語言搜索和排序
我們在XML格式的文件。每個文檔都包含多語言文本。文件數量和語言本身因文件而異。請參閱以下示例:
<document>This is a sample document, which is describing a <word lang="de">tisch</word>, a <word lang="en">table</word> and a <word lang="en">desk</word>.</document>
文檔的關鍵字標有特殊元素和語言屬性。
當我創建Lucene索引我提取XML和對語言和關鍵字的(我不知道如果我要)文本內容,就像這樣:
This is a sample document, which is describing a tisch, a table and a desk.
de - tisch
en - table
en - desk
我不知道具體如何創建一個索引,我將能夠搜索例如: - 所有包含德語單詞tisch的文檔(而不是包含其他語言的單詞tisch的文檔)。
而且我想指定在運行時排序: 我想按用戶指定的語言順序(取決於用戶界面)進行排序。例如,如果我們有兩個文件:
<document>This is a sample document, which is describing a <word lang="de">tisch</word>.</document>
<document>This is a another sample document, which is describing a <word lang="en">table</word>.</document>
和「蒂施或表」上的英文界面的用戶搜索我想先拿到第二個結果。
的任何信息或建議表示讚賞。
非常感謝!