0
我有幾個文本文件,我正在計算這些文件中的字符但不是所有字符。我只需要計算在這些文件中發生了多少次字母a,b和c。我對豬很新。任何幫助,將不勝感激。謝謝!如何計算字符
我有幾個文本文件,我正在計算這些文件中的字符但不是所有字符。我只需要計算在這些文件中發生了多少次字母a,b和c。我對豬很新。任何幫助,將不勝感激。謝謝!如何計算字符
將所有使用通配符*的文件加載到chararray類型的字段中。將該行分成單詞,然後分成字母和數字。
A = LOAD '/path/text*.txt' AS (lines:chararray);
B = FOREACH A GENERATE FLATTEN(TOKENIZE((chararray)lines)) AS words;
C = FOREACH B GENERATE FLATTEN(TOKENIZE(REPLACE(words,'','|'), '|')) AS letters;
D = FILTER C BY (letters matches '.*(a|b|c).*');
E = GROUP D BY letters;
F = FOREACH E GENERATE group,COUNT(D);
DUMP F;
看起來你希望我們爲你寫一些代碼。儘管許多用戶願意爲遇險的編碼人員編寫代碼,但他們通常只在海報已嘗試自行解決問題時才提供幫助。證明這一努力的一個好方法是包含迄今爲止編寫的代碼,示例輸入(如果有的話),期望的輸出以及實際獲得的輸出(控制檯輸出,回溯等)。您提供的細節越多,您可能會收到的答案就越多。檢查[FAQ]和[問]。 –
這將是很好的知道你已經嘗試過。 輸入和預期輸出,以獲得更快速的幫助。 –