我已經安裝了spark和cassandra集羣,並且在我的火花作業中使用了cassandra連接器。現在運行我的工作,我使用spark.cassandra.connection.host並在一個數據中心中傳遞種子節點的一個IP地址。我正在瀏覽連接器網站,其狀態如火花cassandra連接器中的多個接觸點
"The initial contact node given in spark.cassandra.connection.host can be any node of the cluster. The driver will fetch the cluster topology from the contact node and will always try to connect to the closest node in the same data center. If possible, connections are established to the same node the task is running on."
我的查詢是如果聯繫節點關閉會發生什麼情況。 Spark將無法獲得集羣拓撲,因此無法工作。 我還用cassandra的nodejs連接器,在那裏我們提供了一個接觸點陣列。是否有可能在火花卡桑德拉連接器
是的,但我的問題仍未得到解答。那麼如果Spark所連接的節點關閉並且尚未發現拓撲,我認爲它將無法連接和檢索數據,如果發生什麼情況 – Nipun
從我理解的情況來看...... spark沒有連接到特定的節點,它連接到主機,然後選擇一個節點。如果您的主機停機,那麼您的應用將失敗。如果主機上的所有節點都關閉,則應用程序將失敗。所以是的,如果你的主機關閉了,那麼它將無法檢索數據。 – dannypaz
主機和節點有什麼區別?按照文檔「spark.cassandra.connection.host中給出的初始接觸節點可以是任何節點」 – Nipun