回答

0

不,但如果我是對的,你可以重新處理你的數據。這將覆蓋部分寫入。在寫入Cassandra時,當您嘗試使用相同主鍵插入數據時,會使用一種更新(upsert)。

2

否.Spark(和Cassandra就此而言)不會基於整個任務執行提交樣式插入。這意味着你的寫作必須是冪等的,否則你最終會出現奇怪的行爲。

+0

有關如何使它們具有冪等性的任何輸入?我面臨的問題與cassandra表中的重複記錄與任務之間的故障之間,並從頭開始重新啓動任務 –

+0

大家好,任何投入就此? –

+0

確保你沒有寫入重試時改變的內容。警惕非冪等操作(添加到列表和地圖)。基本冪等事物。無論代碼執行多少次,您都應該保持一致。 – RussS