什麼是使用Apache Storm保存數據的正確方法

因此，我可以使用Apache Storm將數據保存在Solr中。但似乎相同的價值被多次保存。現在我正在通過它的鏈接，但可以請幫助我知道什麼是使用Apache Storm保存數據的最佳方式。我正在使用shufflegrouping。什麼是使用Apache Storm保存數據的正確方法

謝謝，

問候

Parag Dharmadhikari

因此，在這裏使用案例，我收到風暴中的推文，並在NLP操作之後將其保存在Solr中，這是句子檢測。但是相同的句子正在被儲存。所以任何機構都可以幫助我。 –

謝謝，提供建議。但我已經解決了這個問題。這是我的不好，所以改變了我的代碼。 –

基本上，風暴支持「至少一次」，而不是「恰好一次」，所以數據的重複是可能的。

但是這種重複不會沒有理由發生，它通常是由一些例外引起的。

你需要看到有很多按摩失敗的風暴Web用戶界面。那麼你應該檢查你的代碼包含：1.你的代碼中的任何異常？ 2.每個消息都以正確的方式發揮作用嗎？ 3.該過程是否太慢，這將導致超時並使信息失敗。

此外，你可以看到storm trident，它支持「完全一次」處理。

2017-08-11 03:03:01 Solo

首先確保您的Solr index is using a unique ID。對於你的情況，你有兩個選擇：

在國內率先採用數據自己

有無Solr中生成一個唯一的ID可能是最容易。你可能只是散佈你的輸入來獲得一個唯一的ID，並將其包含在你發送給Solr的「文檔」中。

2017-08-11 15:59:13

回答