我正在運行Cloudera的Hadoop發行版,一切正常。hdfs包含大量.seq文件。我需要將所有.seq文件的內容合併到一個大的.seq文件中。但是,getmerge命令我沒有爲我做任何事情。然後我使用cat並將一些.seq文件的數據傳送到本地文件上。當我想將此文件「放」到hdfs中時,它什麼也不做。沒有錯誤信息顯示出來,也沒有創建文件。Hadoop把命令無所作爲!
我能夠在hdfs中「touchz」文件和用戶權限在這裏沒有問題。put命令根本行不通。我做錯了什麼?
我正在運行Cloudera的Hadoop發行版,一切正常。hdfs包含大量.seq文件。我需要將所有.seq文件的內容合併到一個大的.seq文件中。但是,getmerge命令我沒有爲我做任何事情。然後我使用cat並將一些.seq文件的數據傳送到本地文件上。當我想將此文件「放」到hdfs中時,它什麼也不做。沒有錯誤信息顯示出來,也沒有創建文件。Hadoop把命令無所作爲!
我能夠在hdfs中「touchz」文件和用戶權限在這裏沒有問題。put命令根本行不通。我做錯了什麼?
編寫將所有序列文件合併爲一個作業的作業。這只是標準的映射器和減速器,只有一個減少任務。
如果「hadoop」命令失敗,你應該看看它。
只需鍵入:'hadoop',這會給你「hadoop」可執行文件的位置。它是一個shell腳本,只需編輯它並添加日誌記錄即可查看發生了什麼。
如果hadoop bash腳本在開始時失敗,那麼hadoop dfs -put命令不起作用就不足爲奇了。
我可以做到這一點,但是這個特殊的情況令我困惑。爲什麼「放」命令沒有做任何事情,它甚至沒有給我一個錯誤信息! – 2011-03-14 13:42:15
使用-copyFromLocal,這將肯定會工作 – 2011-03-14 13:44:15
嘗試-copyFromLocal太,即使這是行不通的。同步問題,沒有錯誤消息,並沒有創建/複製文件。我想通知另一個問題。通常,當我們鍵入只是「 hadoop「,它會提供幫助信息,或者如果環境變量未設置,則會給出錯誤消息。但是在這種情況下,鍵入」hadoop「也不會做任何事情。絕對沒有任何問題.Bash靜靜地來到下一個提示符。兩個問題是同一問題的一部分? – 2011-03-14 14:00:37