2016-09-15 21 views
0

我有來自SparkStreaming的數據流。我需要處理並最終想要將數據存儲在Cassandra中。所以,早些時候我試圖使用SparkCandandra連接器。但是它並沒有給予Worker上的SparkStreaming Context對象的訪問權限。所以,我必須使用單獨的cassandra-scala驅動程序。因此,我結束了phantom。現在,我的問題是我已經定義了cassnandra中的列族。那麼,我該如何做scala的select和update查詢。我們如何使用幻像驅動程序選擇查詢而無需定義表格

我已經按照這些文檔link1,但我不明白爲什麼我們需要在客戶端(scala代碼)一側給表定義。爲什麼我們不能只給KeyspaceClusterPointsColumnFamily並且完成它。

回答

0

這使用虛擬尚不可能,我們正在積極努力phantom-spark讓你做到這一點,但在這個階段,在這個時間仍是幾個月之遙。

在此期間,您將不得不依靠spark cassandra連接器並使用非類型安全的API來實現此目的。這是一個更不幸的設置,但在不久的將來這將得到解決。

+0

是否有可能,如果我創建表定義並在scala中執行映射,那麼我可以通過spark-workers插入到'cassandra'列族嗎? – Naresh

相關問題