2012-11-06 100 views
0

嘗試用'xxx'替換html文件中的文本塊,使用re.sub,python 2.7。我只能使用沒有空格或換行符的基本字符串。此代碼找不到任何替代。我試過DOTALL和其他東西,但沒有任何作用。它只是打印整個文件。我已經成功地使用了re.search,但這不起作用。re.sub in python 2.7

CODE:

print re.sub(r'table\sstyle\=(.+)script', r'xxx', text, re.S) 

正在搜索(文本):

<table style="background-color: #ecddb0"> 
<tbody> 
<TR> 
<TD> 
<style type="text/css"> 
body { 
background-color: #ffffff; 
margin: 0px; 
padding: 0px 0 0 0px; 
</style> 
<script type="text/javascript 
+2

強制性鏈接:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 - 如果你想清理那些要走的路。 – ThiefMaster

+0

@ThiefMaster說了什麼!另外,'(。+?)'也許。 – Nadh

回答

4

re.sub第四個參數是count。你想設置flags

re.sub(r'table\sstyle\=(.+)script', r'xxx', text, flags=re.S) 
+0

謝謝。將嘗試它。 – user1802244