0
我是否總是保證每個GCE實例只有1個數據流工作者JVM,或者我可能在調度程序在單個GCE實例上激活多個JVM的情況下最終結束 - 例如,如果可能存在許多轉換準備運行,但是運行它們的GCE實例相對較少?Google Cloud Dataflow中的每個GCE實例中實例化了多少個JVM?
我是否總是保證每個GCE實例只有1個數據流工作者JVM,或者我可能在調度程序在單個GCE實例上激活多個JVM的情況下最終結束 - 例如,如果可能存在許多轉換準備運行,但是運行它們的GCE實例相對較少?Google Cloud Dataflow中的每個GCE實例中實例化了多少個JVM?
Dataflow服務不保證每個GCE實例的工作者JVM的數量。
在當前實現中,每個VM有1個工作者。工作人員實際上在一個Docker容器內運行,該容器與主機上的其他進程隔離。
爲了更好地使用多核虛擬機,每個虛擬機的工作人員數量很可能會在未來發生變化。
同樣,現在我們使用JVM中的單個線程來處理工作。
你可以把一個工作單位作爲記錄的子集由一個或多個變換
處理可以請你也上的每個JVM中的線程數有何評論? –
我已更新我的答案來回答此問題。 –