2016-07-22 75 views

回答

2

嘗試<\s+\s+>,並且>\s+

import re 

s = "I/O 1< img > '< input >" 
s = re.sub(r"<\s+", "<", s) 
s = re.sub(r"\s+>", ">", s) 
s = re.sub(r">\s+", ">", s) 
print(s) 

輸出:

I/O 1<img>'<input> 
+0

我已經定義我的starttagopen = re.compile(' <[> A-ZA-Z]'),我該怎麼修改有上面的代碼 – Venu

+0

@Venu我不明白。如果您已經有試過的代碼,請編輯您的問題並將其包含在其中。 – 2016-07-22 07:39:29

0
s= "I/O 1< img > '< input >" 

使用s.find找到HTML標籤的啓動( '<')

s [0:s.find('<')] will s在html標記開始之前選擇從0到索引的子字符串

s [s.find('<'):]將選擇從html標記開始到結束的子字符串。

s.replace( ' ' '')將取代no_spaces空間

(s[0:s.find('<')]) + (s[s.find('<'):].replace(' ','')) 
+0

嗨,空格,特殊字符可以是任意長度。感謝您的迴應。主要目標是修剪空格,「<」 – Venu

+0

之後的特殊字符嗨,我只是做了一個編輯。從'<'的索引開始使用s.find('<') –

+1

請[edit](http://stackoverflow.com/posts/38561914/edit)解釋這是如何幫助解決用戶的問題。 – Pureferret