2017-04-10 80 views
0

我有幾個文本文件,我正在計算這些文件中的字符但不是所有字符。我只需要計算在這些文件中發生了多少次字母a,b和c。我對豬很新。任何幫助,將不勝感激。謝謝!如何計算字符

+1

看起來你希望我們爲你寫一些代碼。儘管許多用戶願意爲遇險的編碼人員編寫代碼,但他們通常只在海報已嘗試自行解決問題時才提供幫助。證明這一努力的一個好方法是包含迄今爲止編寫的代碼,示例輸入(如果有的話),期望的輸出以及實際獲得的輸出(控制檯輸出,回溯等)。您提供的細節越多,您可能會收到的答案就越多。檢查[FAQ]和[問]。 –

+0

這將是很好的知道你已經嘗試過。 輸入和預期輸出,以獲得更快速的幫助。 –

回答

0

將所有使用通配符*的文件加載到chararray類型的字段中。將該行分成單詞,然後分成字母和數字。

A = LOAD '/path/text*.txt' AS (lines:chararray); 
B = FOREACH A GENERATE FLATTEN(TOKENIZE((chararray)lines)) AS words; 
C = FOREACH B GENERATE FLATTEN(TOKENIZE(REPLACE(words,'','|'), '|')) AS letters; 
D = FILTER C BY (letters matches '.*(a|b|c).*'); 
E = GROUP D BY letters; 
F = FOREACH E GENERATE group,COUNT(D); 
DUMP F;