2017-02-09 31 views
-1

我正在使用Azure和現收現付費訂閱。我曾經通過HDInsight爲我自己創建了Spark集羣,並且收取了比預期更多的費用。之後,我搜索瞭如何以經濟的方式使用它,並發現人們通常會刪除它們的羣集以節省成本。我想知道是否有其他方法讓個人用戶使用Spark集羣,並且花費很少。是否有其他訂閱可以用來節省成本?提前致謝。如何使用Azure HDInsight獲取更少費用

+1

您選擇了多大規模的虛擬機?根據您的工作負載,更經濟的尺寸也可能工作。 – GregGalloway

+0

我使用D12(4核心)和D4(8核心)。我發現D4在這個頁面上很貴(https://azure.microsoft.com/en-au/pricing/details/hdinsight/)。 –

回答

1

使用PowerShell或ARM模板可以自動創建和刪除羣集。你是對的,這是典型的模式。

您也可以看看Azure Data Lake Analytics,它針對的是大數據,但是是一種按付費查詢模式。

+0

我明白了。我應該嘗試通過PowerShell自動執行創建和刪除羣集的過程,並且只使用少量內核來使用較小的VM大小。這將合理減少費用。我還發現了關於如何使用Azure自動化的文章(http://www.datamic.net/blog/automate-provisioning-hdinsight-clusters-with-powershell-and-azure-automation)。謝謝 –

+0

也可以查看腳本操作,以便在創建時自動執行某些活動。這將節省重新創建任何定製的時間。 –

0

此外:請留意您的數據集,尤其是您不需要的大數據集。確保你有一個高效的柱形格式進行處理(Parquet,ORC),然後用可分割壓縮(bzip2,LZO,snappy)壓縮它。

您甚至可能會發現,有時重新計算數據集比保留數據集更便宜。

在WASB上意外地保留了比您需要的更多的數據是非常容易的,即使在羣集關閉的情況下也會運行帳單。

最後:確保您的羣集被拆除。這裏至少對於AWS羣集來說,通常的做法是使用Jenkins按計劃啓動/停止羣集。看起來Azure自動化在那裏很適合Azure。

相關問題