2016-03-06 37 views
0

我想解析一些HTML,然後將該HTML寫入.py文件。這裏是我使用的代碼:如何解析HTML,然後將其寫入.py文件

from html.parser import HTMLParser 

class MyHTMLParser(HTMLParser): 
    def handle_data(self, data): 
     print(data) 
     f = open('/Users/austinhitt/Desktop/Test.py', 'w') 
     f = open('/Users/austinhitt/Desktop/Test.py', 'r') 
     t = f.read() 
     f = open('/Users/austinhitt/Desktop/Test.py', 'w') 
     f.write(t + '\n' + data) 
     f.close() 

parser = MyHTMLParser() 
parser.feed('<html>' 
      '<body>' 
      '<p>import time as t</p>' 
      '<p>from os import path</p>' 
      '<p>import os</p>' 
      '</body>' 
      '</html>') 

我沒有得到任何錯誤,但只有最後p標籤的內容被放入該文件。我只想要將p標籤內部添加到文件中的內容,而不是p標籤本身。我需要將每個p標籤的內容添加到文件中,並且我不想使用BeautifulSoup或其他非內置模塊。我正在使用Python 3.5.1

回答

0

在使用「寫入」模式後,您似乎讀取文件「Test.py」,這可能會導致數據丟失。

+0

是的!這似乎工作!謝謝! – HittmanA

相關問題