我想在索引過程中存儲由Solr生成的令牌,例如DictionaryCompoundWordToken
,然後導出它們,並希望使用CSVResponseWriter
。有沒有辦法做到這一點?在索引索引中存儲和導出原始令牌
我知道可以使用分析工具來提供值並查看它們如何被標記化,但我不知道如何對整個索引或至少在查詢的基礎上這樣做。
我想在索引過程中存儲由Solr生成的令牌,例如DictionaryCompoundWordToken
,然後導出它們,並希望使用CSVResponseWriter
。有沒有辦法做到這一點?在索引索引中存儲和導出原始令牌
我知道可以使用分析工具來提供值並查看它們如何被標記化,但我不知道如何對整個索引或至少在查詢的基礎上這樣做。
讓我們看看,我想你想要的是,除了某些領域的原始內容之外,還需要存儲領域價值,但在經過一些分析鏈之後,對嗎?
你會認爲copyFields會有所幫助,但它們不會像存儲它們那樣存儲原始字段值。您需要使用updateProcessor。看看this talk Erik Hatcher在7點30分到20點之間給出了答案,你將會看到這個案例解釋得非常好,有例子和所有例子。
將索引存儲在索引中後,可以將其返回並執行任何您喜歡的操作。
非常完美,非常感謝。我需要一個簡單的基於腳本的UpdateProcessor來獲取令牌 –
查看此方法的一種方法是,您將使用您的DictionaryCompoundWordToken
或任何其他符合您需求的分析將文檔內容編入「mytext」字段。然後你可以用q = *:*來面向「mytext」,你的查詢看起來像這樣:http://localhost:8983/solr/collection1/select?q=*%3A*&start=0&rows=1&wt=xml&indent=true&facet=true&facet.field=mytext
這應該給所有進入mytext的標記。但是我對你在問題中所說的內容並不是100%確信的。讓我知道這有助於。
標記是如何存儲的,因爲我知道它是否沒有被索引爲字段的一部分,我們不能提供這方面的方面!您可以分享我們如何轉換這些令牌並將其存儲在索引中,以便將其作爲方面提供。 – Krunal
1)在你的情況下,你的文本的內容會進入一個字段說「文本」? 2)你期待什麼不僅僅是令牌? – Arun
1)是2)不,只是它產生的標記 –