我一直在想出令牌處理器/令牌過濾器和分析器的正確組合,以利用elasticsearch來匹配URL。在elasticsearch中爲URL字符串生成匹配
不幸的是,似乎我所採取的每種方法都未能找到一個或兩個邊緣案例。我希望有人在那裏或許可以揭示一些輕如下:
如果我已經存儲在elasticsearch以下值:
- http://www.example111.com
- http://www.example111.com/cats
- http://www.example111.com/cats?type=tabby
- http://www.example111.com/cats/dogs
- http://www.example111.com/dogs/cats
- http://www.example222.com/cats
- http://www.example222.com
- http://www.example222.com/cats/dogs
- http://www.example333.com/fish
我想知道我可以使用什麼樣的查詢生成以下搜索字符串和結果集組合(依相關程度排序):
http://www.example111.com/cats/dogs
[4,2,3,1]
這裏表達的總體思路是,結果按照與輸入的相似程度排序,直到tld和scheme。當查詢字符串不匹配或段不匹配時,結果將被丟棄。
根據該查詢示例111/dogs應返回example111.com/dogs/cats,但查詢example222.com/cats不應返回example222.com/cats/dogs。我認爲http://www.example111.com/dogs [5,1]的例子似乎與其他的不一致。 – eemp
啊,是的,謝謝!修訂。 –
只是想知道你是否看過這個? http://stackoverflow.com/questions/18977834/indexing-website-url-in-elastic-search這似乎很有用。 –