0
我需要從具有現有數據的多個服務器構建分佈式故障證明(儘可能)集羣。 我是Hadoop的新手,但據我所知,它比其他產品更接近我的要求。 問題是我已經有一些數據(非常大的文件),我想在Hadoop中可用。 是否有可能將具有現有數據的服務器作爲DataNode添加到Hadoop中? 我該怎麼做才能做到這一點?將具有現有數據的服務器作爲DataNode添加到Hadoop
我需要從具有現有數據的多個服務器構建分佈式故障證明(儘可能)集羣。 我是Hadoop的新手,但據我所知,它比其他產品更接近我的要求。 問題是我已經有一些數據(非常大的文件),我想在Hadoop中可用。 是否有可能將具有現有數據的服務器作爲DataNode添加到Hadoop中? 我該怎麼做才能做到這一點?將具有現有數據的服務器作爲DataNode添加到Hadoop
除了在該盒上部署DataNode之後將現有數據移動到HDFS外,它似乎是不可能的