替換行中子集的值

我有一個dataframe有多個列。我想替換名爲Discriminant的列中的值。現在，只要在另一列ids中滿足條件時，此值就只需要替換爲幾行。我嘗試了各種方法;最常見的方法似乎是使用.loc方法，但由於某種原因，它不適用於我。替換行中子集的值

下面是我不成功嘗試變化：

encodedid - 用於條件覈對

indices變量 - 變量用於子集劃分的dataframe（從零開始）

變形例1：

df[df.ids == encodedid].loc[df.ids==encodedid, 'Discriminant'].values[indices] = 'Y'

變化2：

df[df['ids'] == encodedid].iloc[indices,:].set_value('questionid','Discriminant', 'Y')

變化3：

df.loc[df.ids==encodedid, 'Discriminant'][indices] = 'Y'

Variation 3特別是已經在SO往往說這應該工作，但它給了我下面的錯誤，大多數帖子失望：

ValueError: [ 0 1 2 3 5 6 7 8 10 11 12 13 14 16 17 18 19 20 21 22 23] not contained in the index

任何指針都會高度讚賞特德。

來源

2016-10-17 Patthebug

什麼是指數？你能打印嗎？不知道你在努力達到什麼目的，還向我們展示了你的一小部分df –

你切片太多了。嘗試這樣的：

indexer = df[df.ids == encodedid].index 
df.loc[indexer, 'Discriminant'] = 'Y'

.loc[]需要一個索引列表和列列表。您可以設置很容易地使用=「你需要什麼」

看到你的問題，你可能要設置2列的同時，使得片的值有：

indexer = df[df.ids == encodedid].index 
column_list = ['Discriminant', 'questionid'] 

df.loc[indexer, column_list] = 'Y'

來源

2016-10-17 21:12:21

這就像一個魅力。非常感謝。 – Patthebug

同時爲2列添加了一個示例 –

IMO'df.loc [（df.ids == encodedid），'Discriminant'] ='Y'（如果「encodedid」是一個標量值）或'df.loc [df.ids.isin（encodedid），'Discriminant'] ='Y''（如果「encodedid」是一個列表類似的）應該足夠了 – MaxU

也許像這個。我沒有數據框來測試它，但...

df['Discriminant'] = np.where(df['ids'] == 'some_condition', 'replace', df['Discriminant'])

來源

2016-10-17 21:19:01

替換行中子集的值

回答

相關問題