我是building on some old code from a few years back using the commoncrawl dataset與EMR使用MRJob。該代碼使用下列內MRJob子類映射函數來確定是否在本地或EMR運行:MRJob確定是否在線,本地,emr或hadoop運行
self.options.runner == 'emr'
這似乎無論是從來沒有工作過或不再工作,self.options.runner不通過該任務通過因此始終設置爲默認值'inline'
。問題是,有沒有一種方法可以確定代碼是在當前版本的MRJob(v0.5.0)的本地運行還是在emr上運行。
得到了同樣的錯誤。該問題現在在https://github.com/commoncrawl/cc-mrjob/issues/7進行跟蹤 –