在HDFS中,塊分佈在活動節點/從節點之間。塊的內容是簡單的文本,因此有什麼方法可以查看讀取或訪問每個數據節點中存在的塊嗎?直接在數據節點中讀取塊的內容
2
A
回答
0
作爲整個文件或讀取一個單獨的塊(說塊3)序列?
您可以通過各種機制(包括Java API)讀取文件,但無法在文件中間開始讀取(例如在塊3的開始處)。
0
Hadoop讀取一個數據塊並將每行提供給映射器以供進一步處理。此外,Hadoop客戶端在連接它們之前從不同數據節點獲取與文件相關的塊。所以,應該可以從特定的塊獲取數據。
Hadoop客戶端可能是一個很好的開始查看代碼的地方。但是,HDFS提供了文件系統抽象。不確定從特定塊讀取數據的要求。
0
假設您有對數據節點的ssh訪問權限(和適當的權限),您可以將cd
指定爲存儲塊的路徑,並讀取存儲在該節點上的塊(例如,執行cat BLOCK_XXXX
)。指示塊存儲位置的配置參數是dfs.datanode.data.dir
,默認爲file://${hadoop.tmp.dir}/dfs/data
。更多詳情here。
注意:塊名由HDFS根據其內部塊ID進行編碼。只要查看他們的名字,你就不知道一個塊屬於哪個文件。
最後,我假設你想做這個調試的目的,或者只是爲了滿足你的好奇心。通常情況下,沒有理由這樣做,您應該使用HDFS Web UI或命令行工具來查看文件的內容。
相關問題
- 1. 如何讀取xml中的節點內的屬性數據
- 2. 獲取REXML中的直接父節點
- 3. R:從XML數據中提取特定的節點內容
- 4. 刪除節點直接從數據庫
- 5. 如何直接運行節點模塊?
- 6. 讀取鏈接列表節點內的char數組?
- 7. 直接訪問內容數據庫 - SharePoint
- 8. 直接從SVN倉庫中讀取文件內容
- 9. gdb python模塊讀取內存內容
- 10. 直接讀取SAP數據庫?
- 11. 爲什麼我不能直接獲取`.bss`節的內容?
- 12. 根據索引頁上內容類型的節點內容的自定義塊
- 13. 節點JS讀取緩衝數據
- 14. 如何按節點號阻止直接內容訪問?
- 15. Drupal直接鏈接在節點中添加節點
- 16. 讓內容垂直居中在節
- 17. 讀取XML模塊名XML節點
- 18. 無法使用libxml2讀取XML節點的內容
- 19. Drupal,如何在節點的'內容'中渲染塊?
- 20. 讀取根元素直接下的XML節點數的最有效方法
- 21. C#讀取特定節點內的xml
- 22. 如何根據XPATH中的內容提取節點?
- 23. 連接deepstream節點直接
- 24. 從數據庫中獲取數據塊以節省內存
- 25. 獲取直接火力節點值
- 26. 節點JS中的塊數據
- 27. 在Linux內核中直接讀/寫塊到磁盤
- 28. 在hook_node_view的另一個節點內添加節點的內容
- 29. 如何在Vulkan中填寫數據後讀取VkBuffer的內容?
- 30. ADO.NET數據讀取器與直接在SSMS中執行