我有一臺(EC2)Ubuntu服務器,其中bluepill
工作正常,可以啓動並監控resque
進程(並且它已在其他節點上這樣做以往)。bluepill沒有檢測到進程實際上已經成功啓動,因此創建新進程
我正在建立一個新節點,由於某種原因,在此節點上bluepill
不能識別進程已經啓動並正在運行,因此不斷創建新節點。我對這是什麼造成了一點困惑。 2個節點幾乎相同;他們都是由相同chef
腳本配置的EC2服務器。確實,不工作的人是'生產'和另一個'分期',但是由於這個原因幾乎沒有區別。
在我分叉github項目並開始插入更多的監控之前,有什麼想法或建議,試圖弄清楚發生了什麼?過去有關於此列表的討論關於故障w bluepill
和resque
,但正如我所說,在我的登臺服務器上工作正常,並且在早期的生產服務器上工作良好(儘管我會注意到這個新的生產服務器是紅寶石1.9.3(vs 1.9.2)和3.2(對3.1))。
這是我的.pill
文件(或者更具體地說,我chef
食譜的模板文件):
ENV["RAILS_ENV"] = "<%= node.chef_environment %>"
ENV["QUEUE"] = "*"
Bluepill.application("zmx_app") do |app|
app.working_dir = "/srv/zmx/current"
app.uid = "root"
app.gid = "root"
2.times do |i|
app.process("resque-#{i}") do |process|
process.group = "resque"
process.start_command = "rake resque:work"
process.pid_file = "/srv/zmx/current/tmp/pids/resque_workers-#{i}.pid"
process.stop_command = "kill -QUIT {{PID}}"
process.daemonize = true
end
end
end