2015-07-04 115 views
3

我試圖在標記一些標記並應用其他過濾器之後對它們編制索引。這些標籤可以由多個詞組成。在Elasticsearch中合併標記過濾器

我沒有做的事情是做一個最後的令牌過濾器,它從令牌流中輸出一個令牌。

因此,我希望由多個單詞組成的標籤被刪除,停用詞被刪除,但在保存到索引中之前再次以相同的標記連接(排序關鍵詞標記器的功能,但是作爲過濾器) 。

我發現沒有辦法做到這一點,在Elasticsearch中應用標記過濾器:如果我在白色空間進行標記化,然後幹,所有後續標記過濾器將接收這些干擾單個標記,而不是整個標記流, 對?

比如我想在標籤

狐狸躍過柵欄

被保存在指數整體令牌

狐狸跳過柵欄

而不是

狐狸,跳躍,越過圍欄

是否有這樣做沒有預處理我的應用程序的字符串,然後索引它作爲一個not_analyzed場的方法嗎?

回答