2015-01-02 26 views
1

這裏的好朋友在stackoverflow幫助我弄清楚如何識別我的ubuntu開發機器上特定的cloudera版本。 (dpkg -l | grep cdh)。如何下載特定cloudera發行版的源代碼?

現在我想圍繞這些來源摸索,但我不確定去哪裏下載它們。比方說,我要下載的HDFS源(與Cloudera的MODS的cdh5.3.0):

被dpkg顯示的版本是:

Hadoop的HDFS 2.5.0 + cdh5.3.0 + 781-1.cdh5 .3.0.p0.54〜精確

現在,如果我去這個github回購:https://github.com/cloudera/hadoop-hdfs 我沒有看到任何包含字符串'5.3.0'的標籤。

所以我被困在哪裏看。任何指針將非常感激。

+0

這是Hadoop HDFS; CDH是他們的發行版,包括HDFS。從Apache站點下載HDFS。很明顯,github頁面並不是他們保留任何當前源代碼的地方。 –

+1

感謝您的評論。讀者應該注意到,Apache網站確實有源代碼(這很棒)。但是,該來源不一定包含像Cloudera,Hortonworks等供應商所應用的補丁。 –

回答

4

您有兩種下載cloudera版本特定源代碼的選項。

選項1:從Maven的回購

https://repository.cloudera.com/artifactory/cloudera-repos/org/apache/hadoop/hadoop-hdfs/2.5.0-cdh5.3.0/hadoop-hdfs-2.5.0-cdh5.3.0-sources.jar

https://repository.cloudera.com/artifactory/cloudera-repos/org/apache/hadoop/hadoop-common/2.5.0-cdh5.3.0/hadoop-common-2.5.0-cdh5.3.0-sources.jar

(更改版本和適當的hadoop組件名稱)

選項2:從焦油球回購

Cloudera以tar球的形式提供Hadoop相關(hadoop-x.x.x.tar.gz),這將包含二進制以及源代碼。在以下Cloudera存儲庫中也可以使用它。

http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.5.0-cdh5.3.0.tar.gz

+0

精美地工作。謝謝。 –

+0

選項1爲每個hadoop組件提供單獨的源代碼jar,選項2提供了一個單一文件。在該檔案中還提供了僅來源的tarball,例如, [Hadoop的2.5.0-cdh5.3.0-src.tar.gz](http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.5.0-cdh5.3.0-src.tar.gz) 。 –