2015-02-09 37 views

回答

1

細節取決於你的文件格式和C *的數據模型,但它可能是這個樣子:

  • 從S3文件讀入到一個RDD

    VAL RDD = SC .textFile( 「S3N://mybucket/path/filename.txt.gz」)

  • 操控RDD

  • 寫RDD到卡桑德拉表:

    rdd.saveToCassandra( 「測試」, 「KV」,SomeColumns( 「鍵」, 「值」))

1

什麼@描述phact是通過使用附帶的DataStax企業星火API如果在加載時需要完成ETL工作,這可能非常有用。 僅用於加載,您可以使用批量加載功能sstableloader。這裏有一個tutorial讓你開始。