2013-10-01 199 views
0

我必須將自定義Linux應用程序的輸出提供給Hadoop,看起來亞馬遜EMR是實驗的好方法。我真的只是開始研究Hadoop和亞馬遜文檔,所以一些建議,將不勝感激...亞馬遜EMR問題

我能在SELinux環境中運行我的應用程序?
我可以在Amazon EMR節點上部署/執行我的應用程序(用C++編寫)嗎? 在此環境中,將應用程序(字符串,雙對)輸出到Hadoop的方法是什麼?

謝謝。

回答

0
  1. 是的。您可以根據您的需要配置EMR實例。
  2. 是的,如果你在你的EMR集羣中安裝了g ++,你可以執行你的C++應用程序。 對於以上2種用例,您必須訪問EMR中的主節點。 您可以使用簡單的SSH訪問主節點。
  3. 一種方法是將您的C++應用程序的輸出存儲在文件中。將 文件加載到HDFS/S3。使用HDFS上的該文件作爲Hadoop的輸入。