2017-08-03 104 views

回答

1

從每個DC中讀取LOCAL_QUORUM並進行比較是最直接的。

修復在壓縮任務中構建來自sstables的分區的散列,並比較它們的範圍,這比單獨讀取數據更有效。你可以從代碼中取出那部分來構建一個工具來做同樣的事情......或者如果你可以運行一個(完全不增量的)修復。它記錄它找到的差異。

+0

這兩個建議都很有趣,我猜第一個建議取決於數據集的大小,第二個建議聽起來像一個有趣的項目 – raam86

+0

運行全面修復將是IO密集型任務。還有其他建議嗎?我聽說我們可以運行spark工作來做到這一點。有什麼想法呢? –

+0

spark工作也會讀取所有數據。區別在於讀取所有數據後修復工作只會發送一個merkle樹(哈希)數據比較而spark會將所有數據流過比較。但是,如果你想知道具體的細節,在local_quorum上閱讀的火花作業或腳本會給你更多的細節。 –