0
我無法用豬加載Microsoft Word文檔(.doc或.docx)。實際上,當我嘗試這樣做時,通過使用TextLoader(),PigStorage()或根本沒有加載器,它不起作用。輸出是一些奇怪的符號。豬 - 用豬加載Word文檔(.doc和.docx)
我聽說我可以在JAVA中編寫自定義加載程序,但它看起來非常困難,而且我也沒有理解目前我們如何編程其中的一個。
我想將所有的.doc文件內容放在一個單獨的chararray包中,以便稍後可以使用過濾器函數來處理它。
我該怎麼辦?
謝謝
感謝您的回答。你知道我在哪裏可以找到一個好的和簡單的教程來編寫UDF嗎? –
@shanks_roux我已經添加了一些資源。他們並沒有明確地引導你完成整個過程,但是你應該能夠從他們那裏修補一些東西。 – mr2ert