2017-09-04 72 views
2

我有一個看起來像這樣如何合併列表和CSR矩陣

[0, 
0, 
1, 
0, 
0, 
-1, 
1, 
1, 
0, 
0, 
0, 
0, 
1, 
0,] 

和企業社會責任矩陣編號及其len(lex) = 6064名單

tweets.shape = (6064, 2500) 

如何將它們合併我試圖將它們轉換爲兩個列表都,但是當我嘗試在它的工作,我得到一個錯誤

tweets = list(tweets) 
lex = list(lex) 
tweets_final = np.column_stack([tweets, lex]) 

後,我拆分TRA數據都進不去,我得到以下錯誤

nb.fit(X_train, y_train) 


ValueError: setting an array element with a sequence. 

我怎麼可以添加列表作爲基質

+0

請仔細閱讀[問]和給[mcve]。截至目前,我甚至無法開始告訴你要求什麼。 –

+0

你爲什麼要這樣做:'list(tweets)'? – Divakar

+0

嘗試使用'np.asarray(mylist)'將列表轉換爲數組,然後繼續。 –

回答

3

的列,您可以使用scipy.sparse.hstack到水平堆疊這兩個(逐列)。我們只需要在列表轉換爲列向量(稀疏矩陣來說的),或者與單個列的二維數組 -

scipy.sparse.hstack((tweets, csr_matrix(lex).T)) 

scipy.sparse.hstack((tweets, np.asarray(lex)[:,None])) 

採樣運行 -

In [189]: from scipy.sparse import csr_matrix 

In [194]: import scipy as sp 

In [190]: a = np.random.randint(0,4,(5,10)) 

In [192]: a 
Out[192]: 
array([[2, 1, 1, 1, 0, 3, 1, 3, 2, 1], 
     [0, 2, 1, 2, 3, 0, 1, 1, 2, 3], 
     [0, 1, 1, 1, 2, 3, 0, 1, 0, 1], 
     [0, 0, 3, 0, 3, 0, 1, 0, 3, 1], 
     [1, 0, 2, 3, 3, 3, 2, 2, 0, 1]]) 

In [193]: b = [9,8,7,6,5] # equivalent to lex 

In [191]: A = csr_matrix(a) # equivalent to tweets 

In [195]: sp.sparse.hstack((A, csr_matrix(b).T)) 
Out[195]: 
<5x11 sparse matrix of type '<type 'numpy.int64'>' 
    with 42 stored elements in COOrdinate format> 

In [197]: _.toarray() # verify values by converting to dense array 
Out[197]: 
array([[2, 1, 1, 1, 0, 3, 1, 3, 2, 1, 9], 
     [0, 2, 1, 2, 3, 0, 1, 1, 2, 3, 8], 
     [0, 1, 1, 1, 2, 3, 0, 1, 0, 1, 7], 
     [0, 0, 3, 0, 3, 0, 1, 0, 3, 1, 6], 
     [1, 0, 2, 3, 3, 3, 2, 2, 0, 1, 5]]) 
+0

非常感謝。完善 –