0
我使用Avro的文件數據存儲在HDFS複製。我需要從一個avro文件複製選定的列數據並將其發送到同一個集羣中具有其自己的模式文件(具有選定列信息)的另一個位置。我怎樣才能做到這一點?是否可以使用Hive實現?或者HDFS中是否有任何實用工具可以幫助我做到這一點?HDFS集羣內與選定列
這是必需的,因爲一組必須能夠訪問整個表,而另一組應該能夠訪問只有幾列。所以,我需要它們只在HDFS中的一個單獨位置,只有所需的模式和avro文件。
請分享您的單詞詳細信息 – Raghavendra
_「intercluster」_表示您正在兩個不同的羣集之間移動數據。這裏不是這種情況。請刪除該單詞或替換爲「intracluster」(但沒有用)。 –