10
我想在Spark中使用java.time.format中的DateTimeFormatter,但它似乎是不可序列化的。這是代碼相關的塊:Spark和不可序列化DateTimeFormatter
val pattern = "<some pattern>".r
val dtFormatter = DateTimeFormatter.ofPattern("<some non-ISO pattern>")
val logs = sc.wholeTextFiles(path)
val entries = logs.flatMap(fileContent => {
val file = fileContent._1
val content = fileContent._2
content.split("\\r?\\n").map(line => line match {
case pattern(dt, ev, seq) => Some(LogEntry(LocalDateTime.parse(dt, dtFormatter), ev, seq.toInt))
case _ => logger.error(s"Cannot parse $file: $line"); None
})
})
我怎樣才能避免java.io.NotSerializableException: java.time.format.DateTimeFormatter
例外呢?有更好的庫來解析時間戳嗎?我讀過Joda也不是可序列化的,並且已經被合併到了Java 8的時間庫中。