我以獨立模式運行Spark。它讀取幾個文件作爲RDD
,處理它們,將結果合併到單個數據幀中,並將數據幀保存到本地磁盤中的parquet文件中。抑制Spark實驗中的日誌記錄
df.write.mode(SaveMode.Overwrite).parquet(output)
該過程產生有噪聲的輸出。我有記錄的30GB的(我的輸出拼花文件小於10倍!),主要是在這個喜歡格式:
root
|-- column1: string (nullable = true)
|-- column2: string (nullable = true)
|-- column3: string (nullable = true)
|-- column4: string (nullable = true)
|-- column5: string (nullable = true)
我怎樣才能抑制輸出?
我已經試過標準壓制技巧,他們都沒有幫助。
sc.setLogLevel("FATAL")
和
Logger.getLogger("org").setLevel(Level.OFF)
Logger.getLogger("akka").setLevel(Level.OFF)
我試過這種方法和@Denis方法 - 這些都不起作用。我看到日誌記錄設置已更改(某些日誌被壓制),但我仍然有很多類似於模式的消息「root | - column1:string ...」。 –
@DmitryPetrov嘗試將'log4j.properties'添加到'$ SPARK_HOME/conf'目錄中。重新啓動火花服務器並報告結果。 – javadba
它沒有幫助。我仍然有巨大的輸出與模式:( –