我有權訪問具有基本R(2.14.1)但每個節點中未安裝附加軟件包的Hadoop集羣。我一直在編寫基本的R mapper和reducer流腳本來解決這個事實,即我沒有額外的軟件包。但是,我已經到了需要使用某些軟件包的地步,主要是rjson,作爲我的腳本的一部分。在Hadoop節點上臨時安裝R包以進行流式傳輸作業
我沒有羣集的管理員權限,並且用戶帳戶相當有限。讓集羣管理員在每個節點上安裝軟件包不是一個選項(現在),並且集羣沒有外部Internet訪問權限。
我已經將rjson_0.2.8.tar.gz源文件上傳到我的網關節點。是否可以通過在這些行中添加install.packages("rjson_0.2.8.tar.gz", repos = NULL, lib = /tmp)
或某些東西來臨時安裝R包,以便在腳本啓動時安裝包,並通過流作業的-cacheArchive參數傳遞源代碼?我希望將軟件包安裝在臨時位置,以便在作業完成時消失。
這甚至可能嗎?
我知道我會得到一些「使用python」的答案,因爲它是用於處理JSON,這是一個選項,但問題是任何包。 :)
這聽起來像一個有趣的方法。我想了解更多。我的環境是RHEL。我實際上嘗試從網關源安裝一個軟件包,但由於用戶限制,我得到了「無法編譯」錯誤。我嘗試的另一種方法是在另一臺RHEL計算機上tar.gz軟件包的安裝目錄,並將其作爲歸檔文件提交,但是我還沒有能夠讓它工作。 – wahalulu