0
Hello我試圖在git存儲庫上運行map reduce作業。我想要使用地圖作業首先同時將所有存儲庫克隆爲hdfs,然後再對這些文件進行縮減作業。我遇到了一個問題,我不知道如何編寫庫文件到hdfs。我見過寫單個文件的例子,但那些文件在映射器之外,只寫單個文件。 jgit api只公開從文件繼承的filerepository結構,但hdfs使用寫入爲數據輸出流的路徑。有沒有一種很好的方法可以在兩者之間進行轉換,或者有任何類似的例子嗎?Hadoop和jgit在java.io.file和dataoutputstream之間進行轉換
感謝