因此,我可以使用Apache Storm將數據保存在Solr中。但似乎相同的價值被多次保存。現在我正在通過它的鏈接,但可以請幫助我知道什麼是使用Apache Storm保存數據的最佳方式。我正在使用shufflegrouping。什麼是使用Apache Storm保存數據的正確方法
謝謝,
問候
Parag Dharmadhikari
因此,我可以使用Apache Storm將數據保存在Solr中。但似乎相同的價值被多次保存。現在我正在通過它的鏈接,但可以請幫助我知道什麼是使用Apache Storm保存數據的最佳方式。我正在使用shufflegrouping。什麼是使用Apache Storm保存數據的正確方法
謝謝,
問候
Parag Dharmadhikari
基本上,風暴支持 「至少一次」,而不是 「恰好一次」,所以數據的重複是可能的。
但是這種重複不會沒有理由發生,它通常是由一些例外引起的。
你需要看到有很多按摩失敗的風暴Web用戶界面。那麼你應該檢查你的代碼包含:1.你的代碼中的任何異常? 2.每個消息都以正確的方式發揮作用嗎? 3.該過程是否太慢,這將導致超時並使信息失敗。
此外,你可以看到storm trident,它支持「完全一次」處理。
首先確保您的Solr index is using a unique ID。對於你的情況,你有兩個選擇:
在國內率先採用數據自己
因此,在這裏使用案例,我收到風暴中的推文,並在NLP操作之後將其保存在Solr中,這是句子檢測。但是相同的句子正在被儲存。所以任何機構都可以幫助我。 –
謝謝,提供建議。但我已經解決了這個問題。這是我的不好,所以改變了我的代碼。 –