2011-11-01 172 views
0

誰能幫我用下面的查詢 什麼是Python的方式來清潔以下字符串:蟒蛇閱讀串

可以說我有這個詞

"abcd 

'blahblah 

那麼這個單詞實際上是

abcd, blahblah 

我可以想到一個基本的方式..但實際上我正在閱讀一個巨大的文本文件.. 和明確寫一個代碼來讀取char字符似乎是矯枉過正,絕對不pythonic ..我相信有一個pythonic方式來做到這一點.. :) 謝謝

回答

2

您可以使用str.strip()方法從字符串的開頭和結尾去掉不需要的字符。

>>> '"abcd'.strip('"\'') 
'abcd' 
>>> '\'blahblah'.strip('"\'') 
'blahblah' 
>>> print('"abcd'.strip('"\'')) 
abcd 
>>> print('\'blahblah'.strip('"\'')) 
blahblah 
+0

以及如何去除開始和結束時的單引號..?不應該出現像abcd而不是'abcd' – Fraz

+1

不,它只是在引號中,因爲返回值本身就是一個字符串。如果您自己打印該值,則會看到該字符串中沒有更多引號。爲了證明這一點,我改變了答案。 – poke

1

看起來你只想從每個單詞的字母字符。

import re 
_regex = r'\W+' #word characters only  

#read in input 
#split input on ' ' (space), to get words 

for word in list_of_words: 
    word = re.sub(_regex, '', word)