2016-07-11 73 views
0

我一直在試圖創建同時使用Web UI,而下面的命令一個新的集羣: gcloud dataproc clusters create cluster-2 --zone europe-west1-b --master-machine-type n1-standard-1 --master-boot-disk-size 50 --num-workers 2 --worker-machine-type n1-standard-1 --worker-boot-disk-size 50 --project <project-name>Google雲新集羣生成失敗。

集羣由一個主節點和2個工作節點的,這是一個非常小的集羣。虛擬機生成並正常運行。但是,羣集生成失敗。

羣集生成期間顯示的錯誤消息指向文件「dataproc-startup-script_output」。我發現的唯一錯誤消息是該文件中的Error: "--max_wait_seconds" does not look like a port

我擁有的虛擬機數量是5.單機可以創建併成功運行。在最近的幾天(前幾天),我能夠創建一個沒有問題的集羣。該羣集現在被刪除。是否有限制可以創建多少個集羣?

+0

這是否一貫發生?如果它再次發生,您可以運行'gcloud數據集羣診斷cluster-2'並將生成的tarball發送到[email protected].com?您可以創建的羣集數量沒有限制;如果您達到配額限制,那麼在嘗試創建羣集之前應該顯示配額錯誤消息。 –

+0

另外,自上次成功部署以來,您是否更改過任何項目網絡設置?任何使用init操作? –

回答

1

總結從電子郵件線程分別跟進的結果,一般來說,如果:

  1. 它需要超過10分鐘左右出現故障,並
  2. 你已經改變了項目的網絡設置都

然後,一個潛在的罪魁禍首是網絡配置錯誤。一般來說,Dataproc羣集需要彼此完全內部IP網絡訪問,並且通常在您的Google Compute Engine網絡中具有防火牆規則,該網絡打開全部udp:1-65535,tcp:1-65535,icmp,但限於內部IP「源IP範圍」。

在這種情況下,由於較小的輸入錯誤/配置錯誤,該項目確實缺少必要的規則,其中default-allow-internal規則意外地限制源IP範圍的完整掩碼爲/32

如果您沒有進行高級VPN配置或跨項目聯網,請重新添加簡單的10.0.0.0/8 udp:1-65535;tcp:1-65535;icmp防火牆規則。如果你正在進行更高級的網絡連接,你可能希望限制源範圍更具體一些,例如,如果你的網絡的IPv4範圍是10.128.0.0/16那麼你應該設置你的「允許內部」防火牆來使用那個10.128.0.0/16源範圍也是如此。

通過cloud console添加防火牆規則爲選擇適用的源IP範圍提供了便利方法,特別方便您手動枚舉雜亂的子網。