我在GitHub上創建了一個存儲庫,並將其克隆到遠程hadoop集羣git clone <link of my repository>
。 現在我想從hadoop集羣中刪除這個存儲庫。我怎樣才能做到這一點? 我試過cd hadoop fs -rm -r <my repository in cluster>
,但它說:刪除遠程hadoop集羣中的克隆文件
沒有這樣的文件或目錄
我在GitHub上創建了一個存儲庫,並將其克隆到遠程hadoop集羣git clone <link of my repository>
。 現在我想從hadoop集羣中刪除這個存儲庫。我怎樣才能做到這一點? 我試過cd hadoop fs -rm -r <my repository in cluster>
,但它說:刪除遠程hadoop集羣中的克隆文件
沒有這樣的文件或目錄
你缺少一個重要的細節:Hadoop分佈式文件系統(HDFS)比本地文件系統不同的文件系統的羣集節點。讀取/寫入/訪問HDFS的唯一方法是通過hdfs shell命令。
git clone
不會上傳東西HDFS ...
你需要使用SSH遠程集羣和刪除您克隆的目錄中,使用shell命令:
>ssh [email protected]
>rm -r pathOfGitFolder
這將刪除git文件夾從遠程集羣(它從未上傳到HDFS)。如果你想把它上傳到HDFS,你應該在克隆之後使用hadoop shell命令(如hdfs -copyFromLocal)。
有關詳細信息,我建議你閱讀:
https://confluence.atlassian.com/bitbucketserver/basic-git-commands-776639767.html 和 https://hadoop.apache.org/docs/r2.4.1/hadoop-project-dist/hadoop-common/FileSystemShell.html
非常感謝!這是我想要的。 –
混帳克隆不上傳東西HDFS ...只是SSH到遠程集羣,並刪除所克隆的目錄。 – vefthym
@vefthym嗨,我是新來的hadoop。那麼該怎麼做?你的意思是刪除GitHub中的原始目錄,或者?我很抱歉,我不明白。 –