2016-08-22 177 views
0

在CSV改變一個確切值我有一個CSV文件,該文件類似於這樣:使用熊貓

id | item_name1    | item_name2 
-------------------------------------------------- 
1 | unclassified   | text 
2 | SantaCruz unclassified | text 
3 | text     | text 
4 | texttext    | text 
5 | unclassified   | text 
6 | unclassified text  | unclassified 
7 | text     | unclassified text 
8 | text     | text 
9 | text     | text 
.. | ..      | .. 
1000 | unclassified text | text 

我試圖消除所有的細胞,只有說「機密」;即諸如「SantaCruz未分類」的單元應該保持不變。

我發現了很多使用替換函數刪除特定單詞的例子,但是還沒有找到任何僅用於替換完全匹配的單元格的示例。

我正在使用熊貓,並且能夠打開csv,打印等,但在解決此特定問題時遇到了問題。任何幫助將不勝感激!

由於

回答

1

pandas.Series.str.replace可以採取regex作爲參數。假設您要替換的字符串「未分類」中沒有前後空格,則該正則表達式應爲^unclassified$

df['item_name1'].str.replace('^unclassified$', 'replaced_string') 

0   replaced_string 
1 SantaCruz unclassified 
2      text 
3     texttext 
4   replaced_string 
5   unclassified text 
6      text 
7      text 
8      text 
9   unclassified text 
Name: item_name1, dtype: object