0
的RDD
我有一個包含HBase行密鑰的RDD。 RDD相對較大以適應內存。我需要爲每個提供的密鑰獲取值的RDD。有沒有辦法做到這樣的事情:Spark:將HBase行密鑰的RDD映射到值爲
keys.map(key => table.get(new Get(key)))
所以問題是我如何獲得一個HTable內部地圖任務的實例?我是否應該爲每個分區實例化一個HConnection,然後從中獲取HTable實例,還是有更好的方法?
謝謝,但我的意思是不同的:問題是關於在地圖任務中獲取HTable實例。我已經編輯了我的問題以進行澄清。 –