我有一個不尋常的情況。通常情況下,當您搜索文本索引時,您會針對大量條款的文檔搜索少量關鍵字。如何在SOLR/lucene中匹配搜索字符串的子集
例如,您可能搜索「快速棕色」,並期望匹配「快速棕色狐狸跳過懶惰的狗」。
我有這種情況,在我的文檔存儲中有很多小短語,我希望將它們與較大的查詢短語進行匹配。
例如,如果我有一個查詢:
- 「快速的棕色狐狸跳過懶狗」
和文件
- 「敏捷的棕色」
- 「狐狸過來」
- 「懶狗」
我想找到在查詢中出現短語的文檔。在這種情況下,「快速棕色」和「懶狗」(但不是「狐狸結束」,因爲儘管令牌匹配它不是搜索字符串中的短語)。
這種查詢可能與SOLR/lucene?
謝謝羅伯特。我仍在消化你的答案,但似乎是合理的。它似乎假定一個固定的單一大小。如果您的文檔有3個或更多標記,可以適應嗎? – Glen 2011-02-06 23:10:02