1
我有一個表的形式bigdata:如何基於一個欄找到相同的行,並將其標註爲組
Filename A B
xxxxx 1 2
xxxxx 3 4
xxxxx 5 5
xxxxx 6 .
xxxxx . .
yyyyy . .
yyyyy
yyyyy
yyyyy
zzzzz
zzzzz
我需要掃描的第一列的所有行(10,000行大約),並查看文件名更改的位置併爲每個唯一文件名創建一個標籤。通過這種方式,我可以使用生成的標籤創建另一列。
file filename A B
1 xxxxx
xxxxx
xxxxx
2 yyyyy
yyyyy
yyyyy
3 zzzzz
zzzzz
此外,我需要找到列A中每個唯一文件(文件1,文件2 ...)的最大值。任何建議,將不勝感激。由於
它的作品完美!謝謝 – DaphFab