我想解析由我們的服務使用Amazon的Elastic Map Reduce通過Pig程序生成的Tab分隔的數據文件。事情進展順利,除了我們所有的數據文件都包含一個標題行來定義每個列的用途。顯然,(串)報頭不能被轉換爲數值數據,所以我得到的警告從豬這樣的:如何從Hadoop的Pig處理的文件中修剪標題行?
2011-03-17 22:49:55,378 [main] WARN org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.PigHadoopLogger - org.apache.pig.builtin.PigStorage: Unable to interpret value [<snip>] in field being converted to double, caught NumberFormatException <For input string: "headerName"> field discarded
我已經得到了嘗試,以確保我的負荷語句後過濾器不要以後在任何標題行上操作(通過篩選標題詞),但是我想擺脫警告噪聲以避免掩蓋任何潛在問題(如實際數據字段不能正確轉換)。
這可能嗎?