對不起,這個問題還不清楚,我是Hadoop研究中的新手。 我再次編輯了問題。如何閱讀shell腳本中所需的文件
我在Python中編寫了兩個Hadoop MapReduce程序:map.py和red.py. 然後在HDFS上編寫run.sh來繼續使用Hadoop流的MapReduce。
我需要在HDFS上讀取半年的數據,文件名爲:20170101-20170630。
文件在HDFS路徑:
/user/name/20161231
/user/name/20170101
/user/name/20170102
.....
/user/name/20170630
/user/name/20170701
如何寫run.sh讀取所需的文件?
腳本在run.sh的部分:
#! /bin/bash
HPHOME=/opt/cloudera/parcels/CDH
JAR_PACKAGE=/opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-streaming.jar
#it dosen't work, how to read selected file:20170101-20170630
IN_PATH=/user/name/20170[101-630]
OUT_PATH=/user/out
MAP_FILE=/home/map.py
RED_FILE=/home/red.py
非常感謝您!
刪除了「python」標記,這是一個bash問題,而不是python問題。 –
如何將您想要的文件移動或複製到一個目錄中? – williezh