0
我們有兩個集羣X和Y,它們具有相同的密鑰空間但具有不同的數據集。我們正計劃將這些合併爲一個集羣。什麼是實現這一目標的理想步驟,而不會導致應用程序停機?我們有時間系列數據流不斷地寫給卡桑德拉。將具有相同密鑰空間的兩個Cassandra集羣合併爲一個的理想方法是什麼?
我們已排除出口/進口,因爲這會使我們在複印期間丟失數據。
我們也排除sstableloader,因爲這是不可靠的。它經常失敗,沒有辦法從失敗的地方開始。它也有上面提到的同樣的問題。
spark工作是否保留新集羣中每個記錄的現有ttl和writetime信息?它看起來不像。有沒有辦法做到這一點? – noorul
不,但您可以爲每條記錄提供寫入時間,並根據需要指定新的ttl。您還可以指定spark的舊寫入時間。 – phact