我正在使用一個第三方服務,它聚合數據並公開REST API以訪問它。將數據從API加載到HBase
我正在嘗試獲取這些數據並將其加載到本地HBase羣集中。我創建了一個Java應用程序,用於從第三方服務中提取數據,使用HBase客戶端API對其進行處理並將其加載到我們的羣集中。對於這個應用程序,我必須手動運行它,也不知道有多少HBase客戶端API能夠有效地加載批量數據。
我遇到了Sqoop和Cascading-dbmigrate從RDBMS進行批量傳輸。我的問題是:是否有任何類似的工具從REST API進行批量數據傳輸?同樣,在一段時間內同步數據。
感謝 ArunDhaJ http://arundhaj.com
爲了好奇,那麼人們如何設法將Facebook數據(或任何類似的服務,如twitter,reddit)放在羣集上並對數據進行分析?因爲這些服務也只公開API。 – ArunDhaJ
尤其不瞭解Facebook,但在使用外部數據源時,設計ETL過程以提取此數據並將其加載到羣集中,然後根據需要執行任何操作都是非常標準的。我一直在與許多不同的消息來源一起工作,雖然有時候獲取可能是瓶頸,但它仍然是一個必要的步驟。 –