1
我有一個列表(製表符分隔.txt文件),如:名單在矩陣使用Hadoop
row col value
1 1 3.2
10 2 5.3
25 3 2.2
30 1 5.3
等
而且我希望把它變成一個稀疏矩陣,如:
1 2 3
1 3.2
10 5.3
25 2.2
30 5.3
然後填入零。
Hadoop這樣做的最簡單方法是什麼? (我需要使用Hadoop,因爲矩陣的大小約爲3 Tb ......)