2016-07-25 16 views
0

我有與Names{Real Test!, Real Test1!}循環並在它內部循環拋出天(這裏舉例來說,迭代只有1天),在這個循環中的一些操作與數據,然後我flatMap RDD(與2行)到5行的RDD。而就collect().foreach(println)它給了我這樣的:通過循環中的火花保存到卡桑德拉的斯卡拉平面圖

(Real Test!,2016-07-25,session_end,63) 
(Real Test!,2016-07-25,app_open,63) 

的名字 - 和

(Real Test1!,2016-07-25,app_open,63) 
(Real Test1!,2016-07-25,app_install,0) 
(Real Test1!,2016-07-25,session_end,0) 

第二。當我嘗試saveToCassandra循環中的所有5行 - 在數據庫中,我只有最後一行flatMap。

id | name  | date  | count | event 
1 | Real Test! |2016-07-25 | 63 | session_end 
2 | Real Test1! |2016-07-25 | 0 | session_end 

爲什麼它只保存flatMap中的最後一行,以及如何保存所有5行?

+0

cassandra表的模式是什麼? – Knight71

+1

如果您的主鍵是(id,name,date),那麼這是預期的行爲,因爲具有相同主鍵的數據會覆蓋現有數據。 – Knight71

+0

xD是的,你說得對!謝謝!! – ANTVirGEO

回答

0

如果主鍵是(id,name,date),那麼這是預期的行爲,因爲具有相同主鍵的數據會覆蓋現有數據。

+0

你的答案質量很差。請閱讀如何回答關於SO的問題。 – eliasah