7
我有下面的字符串,我試圖找出解決它的最佳做法。使用decode()與正則表達式來避開這個字符串
該解決方案必須具有一定的靈活性,因爲我從API接收到此輸入,並且我不能完全確定當前字符結構(\n
而不是\r
)將始終保持不變。
'"If it ain\'t broke, don\'t fix it." \nWent in for a detailed car wash.\nThe attendants raved-up my engine when taking the car into the tunnel. NOTE: my car is...'
此正則表達式看起來像它應該工作:
text_excerpt = re.sub(r'[\s"\\]', ' ', raw_text_excerpt).strip()
我ASO閱讀decode()
可能的工作(和會是一個更好的解決方案通常情況下)。
raw_text_excerpt.decode('string_unescape')
嘗試沿着這些路線的東西,它沒有奏效。有什麼建議麼?這裏最好的是正則表達式嗎?
似乎是一個公平的解決方案。你可以使用lstrip而不是strip,但這是一個非常小的挑剔。 – Wes 2012-04-22 14:57:26
謝謝Wes。我想我想保持通用帶,但可能不需要。任何想法如何我可以達到與解碼相同的輸出,而不是正則表達式? – Ben 2012-04-22 15:05:03
似乎沒有您嘗試使用的編解碼器:http://docs.python.org/library/codecs.html#codec-base-classes – Wes 2012-04-22 15:12:07