2016-09-09 26 views
0

我對如何用這樣的庫和函數實現它沒有任何想法。任何人都可以給我一些想法。只是一些功能的名稱或想法或一些有用的網站網址將是好的!謝謝!如何用python獲取元素?

我認爲這是不同的。

+0

您的編輯現在使問題**非常**模糊。 –

+0

我很抱歉。我出於某種原因必須對其進行編輯。感謝所有回覆我的人。 –

回答

0

線性迴歸如何映射到您的問題?

  • 給定矩陣X,行可以代表樣本,列可以代表變量。

  • 包含nunmpy.nan值的列表示目標變量(「y」)。其餘的列表示輸入變量(x1,x2,...)。

  • 具有觀察值的行表示訓練集,其餘表示測試集。

代碼

下面的代碼片段使用例如矩陣X

import numpy as np 
from sklearn.linear_model import LinearRegression 

X = np.array([[1, 2, 3], [2, 4, np.nan], [3, 6, 9]]) 

# Unknown rows (test examples), i.e. rows with a nan 
impute_rows = np.any(np.isnan(X), axis=1) 

# Known rows (training examples), i.e. rows without a nan 
full_rows = np.logical_not(impute_rows) 

# Column acting as variable to predict 
output_var = np.any(np.isnan(X), axis=0) 
input_var = np.logical_not(output_var) 

# Check only one variable to predict 
assert(np.sum(output_var)==1) 

# Construct traing/test input/output 
train_input = X[np.ix_(full_rows, input_var)] 
train_output = X[np.ix_(full_rows, output_var)] 
test_input = X[np.ix_(impute_rows, input_var)] 

# Perform regression 
lr = LinearRegression() 
lr.fit(train_input, train_output) 
lr.predict(test_input) 

注意,使用你提供的特定X表示過於簡化的情況下,實現這些點,只有兩點適合,但這些想法應該適用於較大的矩陣。

還要注意,還有其他更專門的方法來從矩陣中歸納缺失值(在您的問題中可以理解這是一個練習)。在矩陣元素之間存在線性關係的情況下,這種特定的方法可能是有效的(正如您的簡化示例中的情況)。