2017-02-08 150 views
1

當我查看數據框中列中的值時,可以看到由於用戶數據輸入錯誤導致同一類別輸入錯誤。Python熊貓替換列中的值

對於我的數據框我用這個代碼:

df['column_name'].value_counts() 

輸出:

Targeted 523534 
targeted 1 
story  25425 
story  2 
multiple 2524543 

有關的故事,我想有一個空間?

我試圖用目標取代目標。

df['column_name'].replace("targeted","Targeted") 

但是沒有發生,我仍然得到相同的數值。

+0

你有沒有'DF [ 'COLUMN_NAME' ] .replace( 「目標」, 「目標」)。value_counts()'? – Zero

回答

1

是的,似乎有開始的結束空白區(s)。

需要str.stripSeries.replaceSeries.str.replace

df['column_name'] = df['column_name'].str.strip().replace("targeted","Targeted") 

df['column_name'] = df['column_name'].str.strip().str.replace("targeted","Targeted") 

另一種可能的解決方案是將所有字符轉換爲小寫:

df['column_name'] = df['column_name'].str.strip().str.lower() 
+0

謝謝你,這個選項工作最好的df ['column_name'] = df ['column_name']。str.strip()。replace(「targeted」,「Targeted」) – jeangelj