大概是noob問題,但有沒有辦法讀取hdfs中的文件內容,除了複製到本地和讀取通過unix?查看hdfs中的文件內容hadoop
所以現在我正在做的事情是:
bin/hadoop dfs -copyToLocal hdfs/path local/path
nano local/path
我想知道如果我可以直接打開文件HDFS,而不是複製它在本地,然後打開它。
感謝
大概是noob問題,但有沒有辦法讀取hdfs中的文件內容,除了複製到本地和讀取通過unix?查看hdfs中的文件內容hadoop
所以現在我正在做的事情是:
bin/hadoop dfs -copyToLocal hdfs/path local/path
nano local/path
我想知道如果我可以直接打開文件HDFS,而不是複製它在本地,然後打開它。
感謝
我相信hadoop fs -cat <file>
應該做的工作。
hadoop dfs -cat <filename> or hadoop dfs -cat <outputDirectory>/*
如果文件大小是巨大(這將是最案的時代),通過做「貓」你不想通過拋出你的文件的全部內容到終端炸燬。相反,使用管道並只獲取文件的幾行。
要獲取文件的前10行,請輸入:hadoop fs -cat'file path'|頭-10
要獲得該文件的最後5行,hadooop fs -cat'file path'|尾-5
如果您正在使用Hadoop 2.x中,你可以使用
hdfs dfs -cat <file>