Python的多處理和共享numpy的陣列

我有一個問題，這是與此類似：Python的多處理和共享numpy的陣列

import numpy as np 

C = np.zeros((100,10)) 

for i in range(10): 
    C_sub = get_sub_matrix_C(i, other_args) # shape 10x10 
    C[i*10:(i+1)*10,:10] = C_sub

因此，顯然沒有必要，運行此作爲串行計算，因爲每個子矩陣可以被獨立計算。我想使用多處理模塊併爲for循環創建最多4個進程。我閱讀了一些關於多處理的教程，但無法弄清楚如何使用它來解決我的問題。

感謝您的幫助

來源

2016-03-08 RoSt

爲了多得性能改進的計算** **必須採取顯著時間。因爲多處理將*序列化*數據，將其發送到子進程，對其進行反序列化並執行計算，序列化結果，將其發送回主進程並最終反序列化它。序列化/反序列化需要相當長的時間，加上進程間通信也不是那麼快。如果'get_sub_matrix'實際上只是一些矩陣訪問，你就不會獲得任何加速。 – Bakuriu

這只是爲了說明的目的。最後，我的矩陣的維數約爲100000 x 20000，但get_sub_matrix_C更爲重要的是速度較慢，我認爲我無法更快地完成該功能。 – RoSt

get_sub_matrix_C是否需要訪問所有矩陣或只是子矩陣？因爲如果需要它，每個子進程的大矩陣的一個副本的序列化將非常耗時且耗費內存。 – eguaio

一個簡單的方法來並行化代碼將使用的過程Pool：

pool = multiprocessing.Pool() 
results = pool.starmap(get_sub_matrix_C, ((i, other_args) for i in range(10))) 

for i, res in enumerate(results): 
    C[i*10:(i+1)*10,:10] = res

我用starmap因爲get_sub_matrix_C函數有多個參數（starmap(f, [(x1, ..., xN)])電話f(x1, ..., xN)）。

但請注意，序列化/反序列化可能需要大量時間和空間，因此您可能必須使用更低級別的解決方案來避免這種開銷。

它看起來像你正在運行一個過時的版本的蟒蛇。你可以用普通map取代starmap但你必須提供一個函數，它接受一個參數：

def f(args): 
    return get_sub_matrix_C(*args) 

pool = multiprocessing.Pool() 
results = pool.map(f, ((i, other_args) for i in range(10))) 

for i, res in enumerate(results): 
    C[i*10:(i+1)*10,:10] = res

來源

2016-03-08 12:59:24 Bakuriu

感謝您的回答。不幸的是我無法測試它，因爲我沒有星圖。可能我正在使用過時的多處理版本？版本：0.70a1 – RoSt

@RoSt您可以使用'map'並修改函數來接受單個參數。我編輯了答案來添加這個解決方案。 – Bakuriu

感謝您提供簡單直接的解決方案。它工作正常。我會投你一票，但我自己的聲望<15，對不起... – RoSt

下面的配方也許可以完成這項工作。隨意問。

import numpy as np 
import multiprocessing 

def processParallel(): 

    def own_process(i, other_args, out_queue): 
     C_sub = get_sub_matrix_C(i, other_args) 
     out_queue.put(C_sub)    

    sub_matrices_list = [] 
    out_queue = multiprocessing.Queue() 
    other_args = 0 
    for i in range(10): 
     p = multiprocessing.Process(
          target=own_process, 
          args=(i, other_args, out_queue)) 
     procs.append(p) 
     p.start() 

    for i in range(10): 
     sub_matrices_list.extend(out_queue.get()) 

    for p in procs: 
     p.join() 

    return sub_matrices_list  

C = np.zeros((100,10)) 

result = processParallel() 

for i in range(10): 
    C[i*10:(i+1)*10,:10] = result[i]

來源

2016-03-08 12:57:56 eguaio

感謝您的回答。我試過了，但是我得到了令人困惑的結果。同樣的條目一遍又一遍地重複着。 – RoSt

我剛糾正了錯誤，抱歉。無論如何，其他答案似乎更簡潔實用。我也會自己試試！ :) – eguaio

Python的多處理和共享numpy的陣列

回答

相關問題