2012-02-21 16 views
1

我有一臺(EC2)Ubuntu服務器,其中bluepill工作正常,可以啓動並監控resque進程(並且它已在其他節點上這樣做以往)。bluepill沒有檢測到進程實際上已經成功啓動,因此創建新進程

我正在建立一個新節點,由於某種原因,在此節點上bluepill不能識別進程已經啓動並正在運行,因此不斷創建新節點。我對這是什麼造成了一點困惑。 2個節點幾乎相同;他們都是由相同chef腳本配置的EC2服務器。確實,不工作的人是'生產'和另一個'分期',但是由於這個原因幾乎沒有區別。

在我分叉github項目並開始插入更多的監控之前,有什麼想法或建議,試圖弄清楚發生了什麼?過去有關於此列表的討論關於故障w bluepillresque,但正如我所說,在我的登臺服務器上工作正常,並且在早期的生產服務器上工作良好(儘管我會注意到這個新的生產服務器是紅寶石1.9.3(vs 1.9.2)和3.2(對3.1))。

這是我的.pill文件(或者更具體地說,我chef食譜的模板文件):

ENV["RAILS_ENV"] = "<%= node.chef_environment %>" 
ENV["QUEUE"] = "*" 

Bluepill.application("zmx_app") do |app| 
    app.working_dir = "/srv/zmx/current" 
    app.uid = "root" 
    app.gid = "root" 
    2.times do |i| 
    app.process("resque-#{i}") do |process| 
     process.group = "resque" 
     process.start_command = "rake resque:work" 
     process.pid_file = "/srv/zmx/current/tmp/pids/resque_workers-#{i}.pid" 
     process.stop_command = "kill -QUIT {{PID}}" 
     process.daemonize = true 
    end 
    end 
end 

回答

2

事實證明,這是bluepill了一個問題,我已付出,固定和submitted a pull request

我不知道爲什麼我沒有意識到,實際上我的兩個環境之間存在差異:staging/old prod在bluepill 0.0.55上,我的新生產環境爲0.0.58。

相關問題