2016-09-19 161 views
2

有人可以解釋爲什麼線程在多處理.Process中不起作用。Python,使用多處理線程

我附上了一些例子來解釋我的問題。

我有一個每秒執行一次並寫入文件的進程。當我從shell運行它時,它按預期工作。

stat_collect.py

#!/usr/bin/env python 
# -*- coding: utf-8 -*- 

from threading import Timer 
from os import path 
from datetime import datetime 

STAT_DATETIME_FMT = '%Y-%m-%d %H:%M:%S' 


def collect_statistics(): 
    my_file = 'test.file' 
    if not path.exists(my_file): 
     with open(my_file, 'w') as fp: 
      fp.write(datetime.now().strftime(STAT_DATETIME_FMT) + '\n') 
    else: 
     with open(my_file, 'a') as fp: 
      fp.write(datetime.now().strftime(STAT_DATETIME_FMT) + '\n') 

    Timer(1, collect_statistics).start() 


if __name__ == '__main__': 
    collect_statistics() 

當我嘗試從其他腳本運行(在後臺運行):只執行一次

#!/usr/bin/env python 

from multiprocessing import Process 
from stat_collect import collect_statistics # logger sc 

if __name__ == '__main__': 
    # This don't work 
    p = Process(target=collect_statistics) 
    p.start() 

    while True: 
     pass 

方法collect_statistics,但如果我用螺紋(target = collect_statistics).start()它就像我從shell運行一樣。爲什麼會發生?

回答

1

這裏是正在發生的事情:

  1. 你開始你的過程
  2. collect_statistics運行
  3. 計時器開始
  4. 現在所謂的過程中(collect_statistics)的函數執行完畢,所以進程 退出,同時殺死定時器。

這裏是如何解決它:

stat_collect.py

#!/usr/bin/env python 
# -*- coding: utf-8 -*- 

from threading import Timer 
from os import path 
from datetime import datetime 
import time 

STAT_DATETIME_FMT = '%Y-%m-%d %H:%M:%S' 


def collect_statistics(): 
    while True: 
     my_file = 'test.file' 
     if not path.exists(my_file): 
      with open(my_file, 'w') as fp: 
       fp.write(datetime.now().strftime(STAT_DATETIME_FMT) + '\n') 
     else: 
      with open(my_file, 'a') as fp: 
       fp.write(datetime.now().strftime(STAT_DATETIME_FMT) + '\n') 

     time.sleep(1) 


if __name__ == '__main__': 
    collect_statistics() 

而對於調用腳本:

#!/usr/bin/env python 

from multiprocessing import Process 
from stat_collect import collect_statistics # logger sc 

if __name__ == '__main__': 
    # This don't work 
    p = Process(target=collect_statistics) 
    p.start() 
    p.join() # wait until process is over, e.g forever 

p.join()只是我更換你無限而循環,這是沒有花費很多的資源。

+0

那麼,調用Process與從命令行運行stat_collect.py不同?以及爲什麼Timer在從Process運行時會被殺死,而在命令行運行腳本時不會被kill? – Ilya

+0

你應該看看python的[GIL](http://www.dabeaz.com/python/UnderstandingGIL.pdf)。基本上在Python中,2個進程根本不互相通信。從命令行運行可以在單個進程中運行代碼,並且所有變量(「Timer」)都是「共享的」。在另一個進程中運行會創建一個父進程(調用腳本)和一個子進程(使用'p = Process(...)'創建)。父進程不會與子進行通信,並且不知道另一個線程已啓動。 – CoMartel