我試圖使用EMR/Hive將數據從S3導入到DynamoDB中。我的CSV文件的字段用雙引號括起來,並用逗號分隔。 在配置單元中創建外部表時,我可以將分隔符指定爲逗號,但是如何指定將這些字段用引號括起來?如何處理使用EMR/Hive將數據從S3導入到DynamoDB中的引用(CSV)中的字段
如果我沒有指定,我看到DynamoDB中的值填充在兩個雙引號「」value「」中,這似乎是錯誤的。
我正在使用以下命令創建外部表。有沒有辦法指定這些字段是用雙引號括起來的?
CREATE EXTERNAL TABLE emrS3_import_1(col1 string, col2 string, col3 string, col4 string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '","' LOCATION 's3://emrTest/folder';
任何意見,將不勝感激。 謝謝 Jitendra
我想,這應該是 '正確' 的答案。任何人?只是一件事,如果你的代碼沒有運行,把「\」「改成」\「。 – kennyut
如果有人再次遇到這種情況。蜂巢現在包括'org.apache.hadoop.hive.serde2.OpenCSVSerde'開箱。請參閱下面的答案。 –