我們有兩個cloudera 5.7.1羣集,一個使用Kerberos進行安全保護,另一個使用Kerberos進行安全保護。在不安全的YARN羣集中運行Spark時訪問安全的Hive
是否有可能在訪問存儲在安全集羣中的配置單元表時使用不安全的YARN集羣運行Spark? (Spark版本是1.6)
如果是這樣,你能否提供一些解釋我如何配置它?
更新:
我想解釋一下我的背後涉及的最終目標。我們的主要安全集羣被大量使用,我們的工作無法獲得足夠的資源在合理的時間內完成。爲了克服這個問題,我們想要使用另一個不安全的集羣中的資源,我們有而不需要需要在集羣之間複製數據。
我們知道這不是最好的解決方案,因爲數據本地化級別可能不是最佳的,但這是我們現在可以提出的最佳解決方案。
請讓我知道,如果你有任何其他的解決方案,因爲它似乎我們無法實現上述。
再次想到,您可以針對遠程安全集羣運行Spark驅動程序...並將結果下載到本地機器上。但是,那麼您需要另一項工作來將這些結果上傳到不安全的HDFS。 –
這對我們的用例並不好。請看我更新的問題。 – Koby
在日常的基礎上使用不安全的集羣來處理安全數據?這破壞了保護數據的目的!這很簡單:要麼承認無法承擔安全,要麼將資源添加到安全集羣。可以是僅計算節點,僅適用於YARN,具有小磁盤容量。 –