任務是在Azure雲中實施ETL項目的部分(變換)。我相信HDInsight是適合它的服務,但不確定。請批准或反駁此選擇。Azure + HDInsight的本地模擬
我對這個領域頗爲陌生,如果有人能指出我在這裏的正確方向,我將不勝感激。
我希望能夠開發出轉換服務(工作),並使用Azure存儲/計算仿真器進行本地測試和的Visual Studio 2012(理想情況下在C#)。我非常確定HDInsight如何適合這張照片(如果有的話)。轉換作業將從blob存儲讀取文本文件並生成(映射減少)數據到azure表存儲。
我首先可能會將其分成兩個問題:一個是在本地執行HDInsight代碼,另一個是關於部署自動化的問題。要回答前者,你有兩種選擇,在本地啓動並運行Hadoop集羣(HDInsight只是一個託管Hadoop集羣),或者在Windows Azure中啓動一個,然後從本地開發環境訪問它。兩者都伴隨着各種成本(人工與計算費用)和難度水平。但是要麼應該工作。 – BrentDaCodeMonkey