Elasticsearch返回舊的SQL結果

我已經建立了從表中的SQL服務器Elasticsearch返回舊的SQL結果

{ 
    "type":"jdbc", 
    "jdbc": 
    { 
     "driver":"com.microsoft.sqlserver.jdbc.SQLServerDriver", 
     "url":"jdbc:sqlserver://[my_ip];databaseName=mega", 
     "user":"sa","password":"******", 
     "sql":"SELECT [OrderID],[CustomerName],[UserFullName],[Status] FROM [Orders_Table]", 
     "poll":"5s", 
     "index": "mega", 
     "type": "orders_search", 
     "schedule" : "0 0-59 0-23 ? * *" 
    } 
}

中提取數據的索引的問題是，我收到unrelevant查詢結果。

例如：]是應僅作爲包含在一次數據庫返回的行密鑰。

{ 

    "from" : 0, "size" : 5, 
    "query": { 
     "multi_match": { 
      "query": "5220668", 
      "fields": [ "_all" ] 
     } 
    } 
}

結果：事情是錯誤的結果。我期待在數據庫中看到只有一個命中。而不是查詢檢索該行的全壽命週期狀態

{ 
    "took": 12, 
    "timed_out": false, 
    "_shards": { 
     "total": 5, 
     "successful": 5, 
     "failed": 0 
    }, 
    "hits": { 
     "total": 4, 
     "max_score": null, 
     "hits": [ 
     { 
      "_index": "mega", 
      "_type": "handledorders_search", 
      "_id": "AU3OlBkh6JN7xIrOkzjm", 
      "_score": null, 
      "_source": { 
       "Status": "NEW", 
       "Date": "2015-06-07T03:00:12.110Z", 
       "UserFullName": "my name", 
       "CustomerName": "cust name", 
       "OrderID": 5220668 
      }, 
      "sort": [ 
       1433646012110 
      ] 
     }, 
     { 
      "_index": "mega", 
      "_type": "handledorders_search", 
      "_id": "AU3Ok0E-6JN7xIrOkvpF", 
      "_score": null, 
      "_source": { 
       "Status": "NEW", 
       "Date": "2015-06-07T03:00:12.110Z", 
       "UserFullName": "my name", 
       "CustomerName": "cust name", 
       "OrderID": 5220668 
      }, 
      "sort": [ 
       1433646012110 
      ] 
     }, 
     { 
      "_index": "mega", 
      "_type": "handledorders_search", 
      "_id": "AU3Ole0-6JN7xIrOk7Yo", 
      "_score": null, 
      "_source": { 
       "Status": "FIX", 
       "Date": "2015-06-07T03:00:12.110Z", 
       "UserFullName": "my name", 
       "CustomerName": "cust name", 
       "OrderID": 5220668 
      }, 
      "sort": [ 
       1433646012110 
      ] 
     }, 
     { 
      "_index": "mega", 
      "_type": "handledorders_search", 
      "_id": "AU3OlQL86JN7xIrOk3eH", 
      "_score": null, 
      "_source": { 
       "Status": "CLOSE", 
       "Date": "2015-06-07T03:00:12.110Z", 
       "UserFullName": "my name", 
       "CustomerName": "cust name", 
       "ExternalOrderID": 5220668 
      }, 
      "sort": [ 
       1433646012110 
      ] 
     } 
     ] 
    } 
}

來源

2015-06-07 shay

不同的狀態爲同一訂單ID保持這種命名法是很重要的。那有什麼問題？ –

看來你的訂單有兩次相同的狀態，你確定查詢只執行一次嗎？在數據中，OrderId也成爲最後一條記錄中的ExternalOrderId。我會先檢查數據並檢查查詢執行的次數。 –

我知道你正在使用的_river插件或類似的東西，並依靠Elasticsearch輪詢MSSQL數據。

棘手的部分是，當文檔更改時，Elasticsearch不知道它是否需要更新文檔或創建一個新文檔。你知道這些文件是一樣的，但是ES沒有。你需要告訴ES，這些文件是相同的。

有兩種不同的方法。第一個是告訴ES，一個特定的字段是唯一的標識符。您將需要創建一個類似的映射到

{ 
    "mega" : { 
     "_id" : { 
      "path" : "OrderId" 
     } 
    } 
}

這種方法已經被廢棄了，因爲1.5.0

https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-id-field.html

另一種可能是最簡單的一種，它是對的OrderId映射到_id在SQL初始化中。

的方式與告訴SQL Server 返回主鍵字段「ID」爲「_id」別名的SELECT語句。這是Elasticsearch用於所有文檔的默認鍵約定。它選擇你的數據時，使 Elasticsearch知道要更新文檔，而不是創建一個新的每一次民意調查

來源

2015-06-07 21:50:50 Gonfva

Elasticsearch返回舊的SQL結果

回答

相關問題