我有一個DynamoDB表,我需要連接到EMR Spark SQL才能在表上運行查詢。我得到了帶有發行標籤emr-4.6.0和Spark 1.6.1的EMR Spark Cluster。獲取emr-ddb-hadoop.jar以將DynamoDB與EMR Spark連接
我指的文檔:Analyse DynamoDB Data with Spark
連接到主節點後,我運行命令:
spark-shell --jars /usr/share/aws/emr/ddb/lib/emr-ddb-hadoop.jar
它給出了一個警告:
Warning: Local jar /usr/share/aws/emr/ddb/lib/emr-ddb-hadoop.jar does not exist, skipping.
後來,當我使用
導入DynamoDB輸入格式
它給人的錯誤:
error: object dynamodb is not a member of package org.apache.hadoop
import org.apache.hadoop.dynamodb.read.DynamoDBInputFormat
error: object dynamodb is not a member of package org.apache.hadoop
import org.apache.hadoop.dynamodb.write.DynamoDBOutputFormat
我認爲這是導致此錯誤的罐子。我在哪裏可以得到這個emr-ddb-hadoop.jar?
如果有人想知道,通常所說的配置文件的位置是/etc/spark/conf/spark-defaults.conf –