6
所以我的輸入數據有兩個字段/列:ID1 & ID2,和我的代碼如下:滾燙:如何在groupBy('field){。size}之後保留其他字段?
TextLine(args("input"))
.read
.mapTo('line->('id1,'id2)) {line: String =>
val fields = line.split("\t")
(fields(0),fields(1))
}
.groupBy('id2){.size}
.write(Tsv(args("output")))
中的輸出結果(我認爲)兩個字段:ID2 *的大小。我有點卡住發現是否有可能保留id2的值,這也是id2分組,並將其添加爲另一個字段?
請看看它是否有意義,我感到同樣的痛苦。 http://stackoverflow.com/questions/25994879/scalding-flatten-fields-after-groupby – Sergey