我是elasticsearch(和底層Lucene引擎)的新手。控制彈性搜索字段的標記化方法
我們存儲有關文件的一些元數據,例如一個單一的文件可以被描述爲:
UniqueHash: ABC123
CreatedBy: John Smith
ApplicationName: MSExcel
ContentType: application/vnd.ms-excel
WordCount: 7000
...
這一切都非常好,索引/搜索,但是當我們來到小面,事情就變得有趣。
FACETING上(比如說)CreatedBy
將返回
John: 1
Smith: 1
或上的ContentType
application: 1
vnd.ms: 1
excel: 1
這些都不是理想的。我沒有直接控制該領域的內容(也就是說,我無法更改基礎數據)。我可以在途中執行轉換,但這會導致存儲不友好的數據,因此搜索按預期工作,這感覺就像是錯誤的方法。
我該如何說服elasticsearch將每個字段(或至少指定的字段)的整個內容視爲用於分面的值?
@javanna謝謝,我沒有發現錯字的一天。 – Basic