2013-03-27 50 views
4

我需要「壓縮」表示信號的python數組的大小。信號看起來像下面的例子。信號壓縮

signal = [ 
    [0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1], #time values 
    [1,1,1,2,3,4,4,4,4,2,1,1] #function values 
    ] 

壓縮後,信號應該看起來像下面的代碼。

signal_compressed = [ 
    [0.0,0.2,0.3,0.4,0.5,0.8,0.9,1.0,1.1], #time values 
    [1,1,2,3,4,4,2,1,1] #function values 
    ] 

您會發現,如果存在具有常數值的區域,則只會存儲此區域的第一個和最後一個值。

我寫了下面的算法來做到這一點。

signal_compressed = [[],[]] 

old_value = None 
for index, value in enumerate(signal[1]): 
    if value != old_value: 
     if index > 0: 
      if signal_compressed[0][-1] != signal[0][index - 1]: 
       signal_compressed[0].append(signal[0][index - 1]) 
       signal_compressed[1].append(signal[1][index - 1]) 
     signal_compressed[0].append(signal[0][index]) 
     signal_compressed[1].append(value) 
     old_value = value 

if signal_compressed[0][-1] < signal[0][-1]: 
    signal_compressed[0].append(signal[0][-1]) 
    signal_compressed[1].append(signal[1][-1]) 

該算法工作正常。對於具有很多不變部分的信號,他的工作速度非常快。但是,如果我嘗試壓縮沒有恆定段的信號(例如正弦信號或噪聲信號),該算法的工作非常緩慢。

如何加快我的算法並節省功能?

回答

1

下面是一個使用生成器做這件事:

def compress(signal): 
    prev_t, prev_val = None, None 
    for t, val in zip(*signal): 
     if val != prev_val: 
      if prev_t is not None: 
       yield prev_t, prev_val 
      yield t, val 
      prev_t, prev_val = None, val 
     else: 
      prev_t, prev_val = t, val 
    if prev_t is not None: 
     yield prev_t, prev_val 

signal = [ 
    [0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1], #time values 
    [1,1,1,2,3,4,4,4,4,2,1,1] #function values 
    ] 
print zip(*compress(signal)) 

我認爲這將是更自然轉signal,儲存它像這樣:

[(0.0, 1), 
(0.1, 1), 
(0.2, 1), 
(0.3, 2), 
(0.4, 3), 
(0.5, 4), 
(0.6, 4), 
(0.7, 4), 
(0.8, 4), 
(0.9, 2), 
(1.0, 1), 
(1.1, 1)] 

這樣兩個zip(*seq)呼叫將是不必要的,整個處理可以在飛行中完成。

最後,如果這對大輸入來說仍然太慢,那麼可能值得使用NumPy。下面是這樣一個解決方案大綱:

import numpy as np 

signal = [ 
    [0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1], #time values 
    [1,1,1,2,3,4,4,4,4,2,1,1] #function values 
    ] 

def npcompress(signal): 
    sig=np.array(signal) 
    idx = np.where(sig[1][1:] != sig[1][:-1])[0] 
    idx_arr = np.sort(np.array(list(set(idx) | set(idx + 1) | set([0]) | set([len(sig[1]) - 1])))) 
    return sig.T[idx_arr] 

print npcompress(signal).T 
+0

謝謝您的回答。我已經嘗試過你的算法並與我的算法進行了比較。對於短信號,你的算法更快。但是對於大量輸入來說,它比我的要慢。你能否用'NumPy'解釋解決方案? – wewa 2013-03-27 13:24:24

+0

@wewa:我已經添加了一個這樣的解決方案的大綱,它沒有Python循環。 – NPE 2013-03-27 13:50:27

+0

我也用'NumPy'試過了這個新算法。這比我的速度快一點。但只有當你不將numpy數組轉換回列表。是否有其他可能性來壓縮我的數據? – wewa 2013-03-27 14:35:46

1

您可以使用itertools.groupby()

In [93]: from itertools import groupby 

In [94]: from operator import itemgetter 

In [95]: ti=[0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1] 

In [96]: fun=[1,1,1,2,3,4,4,4,4,2,1,1] 

In [97]: def func(ti,func): 
    new_time=[] 
    new_func=[] 
    for k,v in groupby(enumerate(func),itemgetter(1)): 
     lis=list(v) 
     if len(lis)>1: 
      ind1,ind2=lis[0][0],lis[-1][0] 
      new_time.extend([ti[ind1],ti[ind2]]) 
      new_func.extend([func[ind1],func[ind2]]) 
     else:  
      new_time.append(ti[lis[0][0]]) 
      new_func.append(func[lis[0][0]]) 
    return new_time,new_func 
    ....: 

In [98]: func(ti,fun) 
Out[98]: ([0.0, 0.2, 0.3, 0.4, 0.5, 0.8, 0.9, 1.0, 1.1], 
      [1, 1, 2, 3, 4, 4, 2, 1, 1]) 
+0

感謝您提供有趣的解決方案。但是這個算法並不比我的速度快。 – wewa 2013-03-27 14:21:40

+0

@wewa使用哪種方法計算這些不同的解決方案? – 2013-03-27 14:35:41

+0

'st = time.clock() cs1 = func(signal) t1 = time.clock() - st' – wewa 2013-03-27 14:41:22