bluepill沒有檢測到進程實際上已經成功啓動，因此創建新進程

我有一臺（EC2）Ubuntu服務器，其中bluepill工作正常，可以啓動並監控resque進程（並且它已在其他節點上這樣做以往）。bluepill沒有檢測到進程實際上已經成功啓動，因此創建新進程

我正在建立一個新節點，由於某種原因，在此節點上bluepill不能識別進程已經啓動並正在運行，因此不斷創建新節點。我對這是什麼造成了一點困惑。 2個節點幾乎相同;他們都是由相同chef腳本配置的EC2服務器。確實，不工作的人是'生產'和另一個'分期'，但是由於這個原因幾乎沒有區別。

在我分叉github項目並開始插入更多的監控之前，有什麼想法或建議，試圖弄清楚發生了什麼？過去有關於此列表的討論關於故障w bluepill和resque，但正如我所說，在我的登臺服務器上工作正常，並且在早期的生產服務器上工作良好（儘管我會注意到這個新的生產服務器是紅寶石1.9.3（vs 1.9.2）和3.2（對3.1））。

這是我的.pill文件（或者更具體地說，我chef食譜的模板文件）：

ENV["RAILS_ENV"] = "<%= node.chef_environment %>" 
ENV["QUEUE"] = "*" 

Bluepill.application("zmx_app") do |app| 
    app.working_dir = "/srv/zmx/current" 
    app.uid = "root" 
    app.gid = "root" 
    2.times do |i| 
    app.process("resque-#{i}") do |process| 
     process.group = "resque" 
     process.start_command = "rake resque:work" 
     process.pid_file = "/srv/zmx/current/tmp/pids/resque_workers-#{i}.pid" 
     process.stop_command = "kill -QUIT {{PID}}" 
     process.daemonize = true 
    end 
    end 
end

來源

2012-02-21 denishaskin