調用數據集的一個子集

x_train = train['date_x','activity_category','char_1_x','char_2_x','char_3_x','char_4_x','char_5_x','char_6_x', 
'char_7_x','char_8_x','char_9_x','char_10_x',.........,'char_27','char_29','char_30','char_31','char_32','char_33', 
'char_34','char_35','char_36','char_37','char_38'] 
y = y_train 
x_test = test['date_x','activity_category','char_1_x','char_2_x','char_3_x','char_4_x','char_5_x','char_6_x', 
'char_7_x','char_8_x','char_9_x','char_10_x','char_1_y','group_1','char_1_y','char_2_y','char_3_y', 'char_4_y','char_5_y','char_6_y','char_7_y', 
'char_8_y','char_9-y','char_10_y', ...........,'char_29','char_30','char_31','char_32','char_33', 
'char_34','char_35','char_36','char_37','char_38'] 

train.iloc([0:17,19:38])

在嘗試使用train([0:17,19:38)]對列進行切片後，我使用了所有列名稱的數據輸入。這樣做很麻煩，但我只能通過19:38獲得。通過調用列名稱，我得到了重要的錯誤信息，以此作爲第一種方式。調用數據集的一個子集

來源

2016-09-28 Bolajio

如果'pandas'行爲就像'numpy'什麼，你應該能夠使用'numpy.r_ [0：17,19：38]'把這些片段變成一個奇特的索引數組。 –

更好：'pandas.np.r_ [0：17,19：38]'。 –

正如@AndrasDeak
建議考慮pd.DataFrametrain

train = pd.DataFrame(np.arange(1000).reshape(-1, 20))

然後使用建議這樣

train.iloc[np.r_[0:17, 19:38]]

來源

2016-09-28 20:08:51 piRSquared

調用數據集的一個子集

回答

相關問題