我剛開始使用Pig來分析一堆使用Hadoop的日誌文件,並且需要根據之前的計算輸出加載不同的文件。 例如,如果計算的輸出是0x18e0,我需要加載一個名爲0x18e0.txt的文件。 如何在LOAD語句中提供參數化文件名?如何在Apache Pig中加載具有參數化名稱的文件
在蟒蛇,它是真正簡單的做到這一點:
x = str(var)
File = open(x + '.txt', 'r')
是否有同樣簡單的方法在豬做到這一點? 我不能給在命令行輸入類似
豬-param輸入=
x.txt
,因爲我不知道x的值之前,我運行該腳本。
我看到另一個選項,指定輸入文件本身作爲參數,如https://wiki.apache.org/pig/ParameterSubstitution所述,但這似乎過分迂迴。有沒有另一種解決方案呢?
x可以採取什麼樣的值? –
我已經舉了一個例子。 x只是一個字符串。在我的情況下,x是一個十六進制數字,表示爲一個與.txt連接的字符串,以使其成爲文本文件。 – Ahmis
會''申報'回答你的需要? – fxm