2016-09-21 115 views
3

刪除編碼,我有以下的數據幀:熊貓:從字符串

str_value 
0 Mock%20the%20Week 
1 law 
2 euro%202016 

有許多這樣的特殊字符,如%20%%2520,etc..How我將它們全部刪除。我嘗試了以下,但數據幀很大,我不知道有多少這樣的不同字符。

dfSearch['str_value'] = dfSearch['str_value'].str.replace('%2520', ' ') 

dfSearch['str_value'] = dfSearch['str_value'].str.replace('%20', ' ') 

回答

7

您可以使用urllib庫,並採用一系列方法map應用它。 示例 -

In [23]: import urllib 

In [24]: dfSearch["str_value"].map(lambda x:urllib.unquote(x).decode('utf8')) 
Out[24]: 
0 Mock the Week 
1    law 
2  euro 2016 
+0

謝謝。但它將歐元%25202016轉換爲歐元%202016。它是否正確? –

+0

我應用了代碼之後還有一個術語,它是'nature%27s%20weirdest%20events' –

+0

@chintans您是否應用過兩次urlencoding?這個'euro%25202016'基本上是'euro%202016'的urlencoding('%'被url編碼爲'%25') – Kamehameha