1
我有數據文件排列在名爲日期的文件夾中。目錄結構Hadoop輸入文件訂單
- /數據/ 2011/03/03
- /數據/ 2011/01/02
等和每個目錄中大約有50個文件,我需要解析並我給hadoop的輸入爲/ data/**/**/**,以便它可以解析所有文件。我的問題是
- 我該如何要求hadoop訂購輸入。我需要按日期解析文件。
- 在解析特定日期的文件時,我需要預先加載與該日期關聯的數據結構,並且位於同一日期目錄中。
感謝 Ankush