我可以繞過HDFS的無更新限制嗎？

感謝您的答案。我還沒有得到我想要的答案。這是一個涉及HDFS和concat api的特殊問題。我可以繞過HDFS的無更新限制嗎？

這是它。當concat談論文件時，它是否意味着只有「由HDFS創建和管理的文件？」或者它會在HDFS不知道的文件上工作，但恰好位於datanode上？

的想法是

最後，就HDFS而言，我有兩個文件。原始和更新的副本。本質上，我將數據塊放在datanode上，而不經過Hadoop。 concat代碼將所有這些新塊放到一個新的HDFS文件中，而不必通過Hadoop傳遞數據。

我不認爲這會工作，但我需要確保它不會。有人建議我作爲更新問題的可能解決方案。我需要說服他們這是行不通的。

HDFS的基本理念是：一次寫入

，多讀

那麼，就不可能與基本實現HDFS的更新文件。如果您使用允許它的Hadoop分支，則只能追加到當前文件的末尾。（原始版本不允許這樣做）

2015-09-10 19:27:51 RojoSam

轉到了HBase的它是建立在Hadoop之上，支持CRUD操作在大數據hadoop世界。如果你不應該使用無SQL數據庫，那麼就沒有機會更新HDFS文件。唯一的選擇是重寫。

2015-09-10 20:00:52 Libin

回答