0
我有一個使用mongoexport
從mongodb導出數據的過程。 由於documentation提到的所有JSON輸出是嚴格模式Mongoexport嚴格json在Spark中的加載
這意味着數據將是這樣的:
"{amount":{"$numberLong":"3"},"count":{"$numberLong":"245"}}
凡爲我的Scala的情況下,類定義爲:
case class MongoData(amount: Long, count: Long)
讀取數據當然會失敗,如下所示:
spark
.read
.json(inputPath)
.as[MongoData]
有沒有辦法要麼從蒙戈出口沒有嚴格的模式或導入JSON Scala中沒有的每個字段手動重組到適當的結構?
'mongoexport'被設計成產生JSON可roundtripped。對此的要求是它不會丟失類型信息。鑑於輸入的性質,我認爲您的解決方案運作良好。 – Ross
是否有其他的開源(cli)工具,允許從mongo出口沒有嚴格的選項? –
然而,由於[DRIVERS-342](https://jira.mongodb.org/browse/DRIVERS-342)的結果,目前還沒有一個輕鬆風格的Json規範正在被批准。一旦設置,所有支持的驅動程序將更新並添加新的寬鬆設置。我不確定當前是否有服務器支持它的計劃。 – Ross