2012-03-23 45 views
1

我所經歷的,在相關HIPI圖像處理API Hadoop的紙:雖然解釋協方差例如 http://cs.ucsb.edu/~cmsweeney/papers/undergrad_thesis.pdfHIPI api:它處理每個地圖任務的1張圖片嗎?

,白皮書說:「因爲HIPI分配每個地圖的任務一個圖像,它是簡單的隨機採樣100張圖像並執行此計算「。

但本文中顯示的第一個數字描繪了一個架構,其中多個圖像被輸入到一個地圖任務中!

令人驚訝的是,他們寫了一個圖像由一個地圖任務處理,因爲它會產生太多的地圖任務,然後他們也正在解決小文件問題。

如果這是真的,那麼序列文件與MultithreadedMapper是一個更好的選擇,我是對還是錯?

在此先感謝..

回答

0

雖然我不能夠說明什麼筆者說在紙,看着爲HIPI的API,我只能看到一個InputFormat:

這部作品的ImageBundle,這是因爲它的聲音 - 在一個單一的文件圖像的集合(包)。

我猜作者可能是想說的是:

因爲HIPI分配每個地圖功能一個圖像,它是簡單的隨機抽樣的圖像100個補丁和執行該計算

查看相關代碼Covariance example支持這一理論。

相關問題