analyzer

    2熱度

    2回答

    我正在使用elasticsearch版本1.2.1。 我有,我想創建一個自定義標記生成器將打破由它們的長度達令牌到一定的最小長度的用例。例如,假設最小長度爲4,標記「abcdefghij」將被拆分爲: 「abcd efgh ij」。 我想知道如果我能實現這個邏輯,而不需要編寫一個自定義Lucene的tokenizer類的? 在此先感謝。

    6熱度

    2回答

    編輯:要添加到此,同義詞似乎與基本querystring查詢一起工作。 "query_string" : { "default_field" : "location.region.name.raw", "query" : "nh" } 這將返回新罕布什爾州的所有結果,但「nh」的「匹配」查詢不會返回任何結果。 我試圖同義詞添加到我的位置字段在我的彈性指數,所以,如果我做了

    1熱度

    1回答

    我們正在實施Elasticsearch並在.NET解決方案中使用.Nest。我們已經創建並加載了包含多個字段的索引。我們希望定義和分析器,當用戶輸入UNV-1234或UNV1234時,將爲itemNumber字段生成相同的搜索結果。 itemNumber字段僅限於項目編號,不含其他字詞。但是,商品編號字段可能有一個空格分隔的編號。 根據我的搜索,似乎關鍵字分析器將提供所需的結果。這不適合我們。 有

    2熱度

    1回答

    字母值Elasticsearch分析令牌我有一個文本字段已經當我檢查使用分析API(默認分析)這個值 - term1-term2-term3-term4-term5-RWHPSA951000155.2013-05-27.log ,我得到這個 - { "tokens": [ { "token": "text", "start_offset": 2

    0熱度

    1回答

    我使用Lucene與vb.net。我想對包含阿拉伯文和英文書的一些書進行全文檢索。我不太清楚我應該使用的分析儀的選擇。如果有人根據他/她的經驗建議我使用正確的分析儀,那將會非常有幫助。由於

    1熱度

    1回答


    1熱度

    1回答

    我們在我們的linux機器上安裝了GoAccess v0.9。我們在nginx中定製了日誌格式。 log_format timed_combined '$remote_addr - $remote_user [$time_local] "$request" $status $body_bytes_sent "$http_referer" "$http_user_agent" "$http_x_fo

    0熱度

    1回答

    我提出了一個_mapping請求elasticsearch,並看到一個字段使用自定義分析器。現場的輸出這樣的: "myFieldName": { "type": "string", "analyzer": "someCustomAnalyzer" } 所以是有一種方式來獲得源爲someCustomAnalyzer?我曾嘗試要求curl -XGET localhost:92

    0熱度

    2回答

    我正在使用Java實現詞法分析器。 Inside「String palavras_reservadas」我有所有保留字不能用來命名變量和類似的東西。匹配器負責在我的輸入代碼中查找這些保留字。 我把我輸入代碼中的所有行放在一個名爲「vetor1」的ArrayList的不同位置。 我想在找到一個保留字時拆分這個「vetor1」。例如,我有這樣的代碼爲我輸入: a = b + c; if (a > b

    3熱度

    3回答

    我把我的代碼爲IAD/AdMob廣告中...... -(void)viewWillAppear:(BOOL)animated{} 廣告完全正常工作的方式,我讓他們現在所有的iOS設備。 當我與我的iPhone Xcode和點擊Product -->Analyze消息指出... 在UIViewController子「iPhoneSIX」的viewWillAppear:實例方法缺少[super v