紗線集羣如果我有3級火花的應用都使用相同的紗線集羣,我應該怎麼設置計算yarn.nodemanager.resource.cpu-vcores與多火花客戶
yarn.nodemanager.resource.cpu-vcores
在每個3紗-site.xml?
(每個火花應用程序需要有它的類路徑上自己的紗線的site.xml)
這是否值,即使在客戶端紗的site.xml的關係呢?
如果確實如此:
假設集羣有16個內核。
應該將每個yarn-site.xml中的值設置爲5(總共15個爲系統進程留下1個內核)?或者我應該將每一個設置爲15?
(注:Cloudera公司表示一個核心應該留給系統進程在這裏:http://blog.cloudera.com/blog/2015/03/how-to-tune-your-apache-spark-jobs-part-2/然而,他們沒有進入使用多個客戶端對同一集羣的細節)
假設星火與紗線作爲主運行,並以集羣模式運行。
Spark使用yarn-site.xml進行客戶端配置。我有不同的應用程序提交了多個spark作業,每個應用程序都有自己的客戶端yarn-site.xml。 – jhnclvr
那麼,在這種情況下,如果您使用一個應用程序請求集羣的所有資源,那麼下一個必須排隊等待第一個完成。 – PermaFrost
我唯一擔心的是這個值在客戶端被忽略,並且yarn.nodemanager.resource.cpu-vcores的服務器端yarn-site.xml值是唯一重要的值。我不會有一個集羣再次測試一段時間來確認這種或那種方式,並且博客文章不清楚。 – jhnclvr