我正在使用Azure和現收現付費訂閱。我曾經通過HDInsight爲我自己創建了Spark集羣,並且收取了比預期更多的費用。之後,我搜索瞭如何以經濟的方式使用它,並發現人們通常會刪除它們的羣集以節省成本。我想知道是否有其他方法讓個人用戶使用Spark集羣,並且花費很少。是否有其他訂閱可以用來節省成本?提前致謝。如何使用Azure HDInsight獲取更少費用
回答
使用PowerShell或ARM模板可以自動創建和刪除羣集。你是對的,這是典型的模式。
您也可以看看Azure Data Lake Analytics,它針對的是大數據,但是是一種按付費查詢模式。
我明白了。我應該嘗試通過PowerShell自動執行創建和刪除羣集的過程,並且只使用少量內核來使用較小的VM大小。這將合理減少費用。我還發現了關於如何使用Azure自動化的文章(http://www.datamic.net/blog/automate-provisioning-hdinsight-clusters-with-powershell-and-azure-automation)。謝謝 –
也可以查看腳本操作,以便在創建時自動執行某些活動。這將節省重新創建任何定製的時間。 –
此外:請留意您的數據集,尤其是您不需要的大數據集。確保你有一個高效的柱形格式進行處理(Parquet,ORC),然後用可分割壓縮(bzip2,LZO,snappy)壓縮它。
您甚至可能會發現,有時重新計算數據集比保留數據集更便宜。
在WASB上意外地保留了比您需要的更多的數據是非常容易的,即使在羣集關閉的情況下也會運行帳單。
最後:確保您的羣集被拆除。這裏至少對於AWS羣集來說,通常的做法是使用Jenkins按計劃啓動/停止羣集。看起來Azure自動化在那裏很適合Azure。
- 1. 在HDInsight上使用C#和PIG Azure
- 2. 如何在帶有Azure Hdinsight的Visual Studio中使用Pig
- 3. 如何使用Azure自動化從HDInsight啓動Spark 2.0
- 4. 如何在Azure HDInsight Linux集羣中使用Zookeeper?
- 5. 如何獲取SqlServerSpatial以使用Azure?
- 6. 如何獲取SimpleLucene.Net以使用Azure
- 7. Azure HDInsight中的Pyparsing
- 8. HDInsight Azure Blob存儲數據更新
- 9. 如何使用Windows Azure ACS從Facebook獲取更多聲明?
- 10. Azure HDInsight參數被錯誤引用
- 11. 如何使用Windows Azure Powershell命令獲取Azure角色實例
- 12. 如何使用Azure SDK獲取Azure VM的公共IP
- 13. azure HDInsight腳本動作
- 14. Azure + HDInsight的本地模擬
- 15. Azure HDInsight MapReduce AdditionalInputPath被忽略
- 16. 使用azure SDK缺少Microsoft.Threading.Tasks
- 17. 使用Windows Azure獲取Facebook用戶名
- 18. 如何使用Azure命令行工具創建3.0版HDInsight羣集?
- 19. 如何使用SWT從Azure ACS獲取用戶信息
- 20. 使用Azure存儲時HDInsight的可擴展性
- 21. 使用本地驅動器在Azure HDInsight上運行Spark程序
- 22. 使用Tez在Azure HDInsight上的Hive上重建索引失敗
- 23. 如何使用svn更新獲取所有更改,使用TortoiseSVN
- 24. 從Apple獲取代碼簽名證書需要多少費用?
- 25. HDInsight Azure上的SparkHistory不顯示任何應用程序
- 26. 花費更多時間使用數據表獲取記錄
- 27. 如何使用twilio api獲取語音通話費
- 28. 如何使用PHP從Stripe獲取收費ID?所有的
- 29. HDInsight - 使用多個存儲?
- 30. Azure存儲如何計費?
您選擇了多大規模的虛擬機?根據您的工作負載,更經濟的尺寸也可能工作。 – GregGalloway
我使用D12(4核心)和D4(8核心)。我發現D4在這個頁面上很貴(https://azure.microsoft.com/en-au/pricing/details/hdinsight/)。 –