創建2D矩陣我有類型的以下RDD((用戶ID,MovieID),1):從RDD
val data_wo_header=dropheader(data).map(_.split(",")).map(x=>((x(0).toInt,x(1).toInt),1))
欲該數據結構轉換成一個二維數組,使得所有元素(用戶ID電影ID)有一個1 else 0
我認爲我們必須映射用戶ID爲0-N,如果N是不同用戶的數量並將電影ID映射到0-M如果不是不同電影的數量。
編輯:如你提到的例子
Movie ID->
Userid 1 2 3 4 5 6 7
1 0 1 1 0 0 1 0
2 0 1 0 1 0 0 0
3 0 1 1 0 0 0 1
4 1 1 0 0 1 0 0
5 0 1 1 0 0 0 1
6 1 1 1 1 1 0 0
7 0 1 1 0 0 0 0
8 0 1 1 1 0 0 1
9 0 1 1 0 0 1 0
The RDD will be of the sort
(userID, movID,rating)
101,1002,3.5
101,1003,2.5
101,1006,3
102,1002,3.5
102,1004,4.0
103,1002,1.0
103,1003,1.0
103,1007,5.0
….
你可以分享預期的輸出格式? – BDR
您可以將輸出視爲每個用戶ID帶有1和0值的2D矩陣,您可以給我一個格式的電影ID對 –
。無法直觀地看到您正在查找的內容 – BDR