我需要使用存儲在本地文本文件中的信息初始化映射器中的對象。有沒有這樣的機制?我可以將本地文件的內容傳遞給Hadoop Pipes作業
1
A
回答
0
您可以將文件上傳到HDFS,然後將其添加到分佈式緩存中,使其可供映射器從工作目錄加載。
上傳本地文件到HDFS並把它在分佈式緩存由通用-files
選項處理
hadoop pipes -files localfile.txt <other pipes options>
現在加載在你的映射文件,只需打開一個文件(你可以假設意志在當前工作目錄中)具有相同名稱(localfile.txt)。
0
將文件本地存儲在客戶端上。閱讀並序列化它並將其添加到Job conf對象中。 在映射器和減速器的設置方法中,從conf對象中讀取值並反序列化它。
COnf對象只存儲字符串。因此,您需要在序列化時將其轉換爲String對象。
相關問題
- 1. 將文件的內容傳遞給FileUtils.cp
- 2. 傳遞的內容作爲參數傳遞給標籤文件
- 3. 將內容傳遞給deleteasync
- 4. 本地hadoop作業的dfs.block.size?
- 5. 如何將參數傳遞給python Hadoop串流作業?
- 6. 將列名傳遞給Hadoop Hive流作業
- 7. 將「本地」對象傳遞給後臺作業
- 8. 將行和文件內容作爲stdin傳遞給程序
- 9. 將此內容傳遞給jQuery插件
- 10. 我可以將變量傳遞給所需的文件嗎?
- 11. 我可以將文件內容傳遞給Krajee的JQuery引導文件輸入插件
- 12. 我們可以將xml格式的文本傳遞給內部xml嗎?
- 13. Powershell的:將參數傳遞給作業
- 14. 我可以將除文件以外的任何其他內容傳遞給SimpleXmlIterator嗎?
- 15. 是否可以將屬性從mapper傳遞給hadoop中的reducer?
- 16. 我可以將$ _GET參數傳遞給本地運行的腳本嗎?
- 17. 是否可以將變量傳遞給Windows FTP腳本文件?
- 18. 如何將可變內容作爲參數傳遞給函數
- 19. 可以將主題傳遞給組件
- 20. Jenkins將SVN_DIR變量傳遞給作業
- 21. 將結果傳遞給作業 - python rq
- 22. 我可以將參數傳遞給Pig腳本中的UDF嗎?
- 23. WebHCat&Pig - 如何將參數文件傳遞給作業?
- 24. 如何將大型tar.gz文件的內容傳遞給STDOUT?
- 25. AJAX/Javascript - 將txt文件的內容傳遞給Javascript變量
- 26. 如何將列表的內容傳遞給現有文件?
- 27. 將文本文件傳遞給arrayadapter
- 28. 將目錄不是文件傳遞給hadoop-streaming?
- 29. C++可以將本地類引用傳遞給函數嗎?
- 30. 傳遞給args的內容[]
'無法識別的選項:-files' – Inverse
@反向 - 良好的捕獲,將管道放在-files選項之前 –