2017-08-09 99 views
0

因此,我可以使用Apache Storm將數據保存在Solr中。但似乎相同的價值被多次保存。現在我正在通過它的鏈接,但可以請幫助我知道什麼是使用Apache Storm保存數據的最佳方式。我正在使用shufflegrouping。什麼是使用Apache Storm保存數據的正確方法

謝謝,

問候

Parag Dharmadhikari

+0

因此,在這裏使用案例,我收到風暴中的推文,並在NLP操作之後將其保存在Solr中,這是句子檢測。但是相同的句子正在被儲存。所以任何機構都可以幫助我。 –

+0

謝謝,提供建議。但我已經解決了這個問題。這是我的不好,所以改變了我的代碼。 –

回答

0

基本上,風暴支持 「至少一次」,而不是 「恰好一次」,所以數據的重複是可能的。

但是這種重複不會沒有理由發生,它通常是由一些例外引起的。

你需要看到有很多按摩失敗的風暴Web用戶界面。那麼你應該檢查你的代碼包含:1.你的代碼中的任何異常? 2.每個消息都以正確的方式發揮作用嗎? 3.該過程是否太慢,這將導致超時並使信息失敗。

此外,你可以看到storm trident,它支持「完全一次」處理。

0

首先確保您的Solr index is using a unique ID。對於你的情況,你有兩個選擇:

  • 指定Solr的唯一ID記錄Solr的文檔

在國內率先採用數據自己

  • 有無Solr中生成一個唯一的ID可能是最容易。你可能只是散佈你的輸入來獲得一個唯一的ID,並將其包含在你發送給Solr的「文檔」中。

  • 相關問題