我有一個指標,與現場「所屬」查詢,一些示例值:Lucene的 - 長串
- 「斯坦福大學醫學院,帕洛阿爾託,美國加利福尼亞州的」
- 「神經生物學研究所,醫學院,斯坦福大學,帕洛阿爾託,加利福尼亞州的學校」,
- ‘雜誌,哈佛大學,馬薩諸塞州波士頓的學校’,
- ‘布里格姆&婦女,醫學,馬薩諸塞州波士頓的哈佛大學校’
- 「哈佛大學,馬薩諸塞州劍橋」
等等...(底線是的隸屬關係都寫在多個方面,沒有明顯的一致性)
我查詢的單位欄索引使用「加州帕羅奧多斯坦福大學醫學院」(使用QueryParser)來查找斯坦福大學的所有相關文檔,我可能會因爲醫學院等的存在而獲得大量假+血統。 :我不能使用短語查詢,因爲在構建關聯的方式中存在可變性)
我試過以下內容:
通過用逗號分割一個空格(在這裏我沒有得到任何結果!)
試圖提高(使用^)拆分搜索短語,促進最後的部分,如「帕洛阿爾託使用SpanNearQuery奧拓CA「,比起最初的短語來得更高。在這裏,我仍然得到很多假的+ ves。
對如何處理這有什麼建議?如果SpanNearQuery的方式去,任何想法,爲什麼我得到0結果?
謝謝我嘗試了這種方法,但是我不能保證查詢條件會比索引值更小。爲了給你一個想法,查詢是通過點擊文本鏈接進行的。任何想法爲什麼spanquery可能不工作? – Mikos 2010-03-24 09:32:18
+1爲你的迴應,但我接近它的不同。 – Mikos 2010-03-25 05:21:40