我有與Names{Real Test!, Real Test1!}
循環並在它內部循環拋出天(這裏舉例來說,迭代只有1天),在這個循環中的一些操作與數據,然後我flatMap RDD(與2行)到5行的RDD。而就collect().foreach(println)
它給了我這樣的:通過循環中的火花保存到卡桑德拉的斯卡拉平面圖
(Real Test!,2016-07-25,session_end,63)
(Real Test!,2016-07-25,app_open,63)
的名字 - 和
(Real Test1!,2016-07-25,app_open,63)
(Real Test1!,2016-07-25,app_install,0)
(Real Test1!,2016-07-25,session_end,0)
第二。當我嘗試saveToCassandra
循環中的所有5行 - 在數據庫中,我只有最後一行flatMap。
id | name | date | count | event
1 | Real Test! |2016-07-25 | 63 | session_end
2 | Real Test1! |2016-07-25 | 0 | session_end
爲什麼它只保存flatMap中的最後一行,以及如何保存所有5行?
cassandra表的模式是什麼? – Knight71
如果您的主鍵是(id,name,date),那麼這是預期的行爲,因爲具有相同主鍵的數據會覆蓋現有數據。 – Knight71
xD是的,你說得對!謝謝!! – ANTVirGEO