這是一個由兩部分組成的問題。如何讓elasticsearch執行完全匹配查詢?
我的文件是這樣的:
{"url": "https://someurl.com",
"content": "searchable content here",
"hash": "c54cc9cdd4a79ca10a891b8d1b7783c295455040",
"headings": "more searchable content",
"title": "Page Title"}
我的第一個問題是如何獲取的所有文件,其中「標題」正是「無題」。我不希望出現標題爲「此文檔無標題」的文檔。
我的第二個問題是如何檢索URL中出現的所有文檔正好在一長串的URL中。
我使用pyelasticsearch,但捲曲的通用答案也可以。
這個解決方案爲索引中的每個*文檔執行腳本非常重要。您應該先對結果進行過濾(例如,對僞代碼「'foo:bar'AND _source.foo ='bar'」)對同一字段使用字符串查詢。我用620k的文件測試了這個索引,速度從「花7245」變爲「花19」 – sfussenegger