0
我有我的文件被處理存儲在HDFS中二進制流格式。 現在,我必須使用map-reduce對文件執行一些處理。 輸入文件被拆分成塊(當文件到達輸入塊時,文件是原始格式) 我的問題是何時發生這種反序列化? 我有我的代碼中實現的可寫接口,它有兩個方法,即readFields和寫入。這些方法是否負責保存在HDFS中的實際數據的序列化和序列化? 如果是的話,您能否解釋一下數據流? 我一直堅持這個概念一整天,請幫助..Hadoop序列化和反序列化