2016-08-31 83 views
-3

我有一個文本文件,文本中包含字母數字和非字母數字字符。Python文本清理刪除非字母數字字符之間的空格

我想刪除兩個非字母數字字符之間的空格。

我該如何有效實現這一目標?

任何方法/流行庫很好。

+3

你嘗試了什麼,你卡在哪裏? SO不是一個開發人員。 – spectras

+0

* from re import sub *應該給你一個開始。 – guidot

+0

正則表達式對於此目的非常有用 –

回答

0

這裏是一個可能的解決你的問題:

import re 

file = """ 
    7  u   p, S a k s F i f t h A v e, A u d i A  4, C a n o n A 7 5 
""" 

print re.sub(r"([A-Za-z0-9])\ *([A-Za-z0-9])\ *", r"\1\2", file) 

我覺得re.sub是去這裏的好方法。

+0

'xy ##'將導致'xy ##'。無論如何,鼓勵那些既不顯示研究也不顯示研究結果的問題並不是一個好主意,用勺子給他們提供解決方案。 – spectras

+0

@spectras的確如此,這個解決方案不適用於你的反例,很好的捕捉。另一方面,我不同意你不鼓勵這類低質量問題的觀點,爲什麼不呢?爲什麼不積極主動並試圖創造出好的答案? – BPL

+0

無可否認,這是我個人對[經常性]的觀點[http://meta.stackoverflow.com/questions/255657/answering-questions-that-show-lack-of-research/255660]有爭議[點](http ://meta.stackoverflow.com/questions/255459/is-it-okay-to-downvote-answers-to-bad-questions)在SO上。因爲這個,我個人不會低估,但我偶爾會在評論中提及它,當問題顯示特別低的努力和答案對其他人不太可能有用時。無論如何,無論如何,鏈接的元問題是比這裏更好的地方討論:) – spectras

相關問題