2
我設置了屬性mapred.textoutputformat.separator
,其值爲\001
。但是當我運行MR Job時,拋出異常:字符引用「&#1」是無效的XML字符
字符引用「&#1」是無效的XML字符。
請幫幫我。
我設置了屬性mapred.textoutputformat.separator
,其值爲\001
。但是當我運行MR Job時,拋出異常:字符引用「&#1」是無效的XML字符
字符引用「&#1」是無效的XML字符。
請幫幫我。
我得到了解決方案。原因是當使用「\ 001」字符序列或其他Unicode字符時,在對象序列化過程中,它被轉換爲一些無效格式。
所以解決辦法是使用的Base64編碼字符,重寫TextOutputFormat類的getRecordWriter方法然後有它進行解碼。(Base64.decodeBase64)
這將工作。