Python - 如何逐行閱讀HTML

我正在嘗試編寫一個程序，它將採用一個HTML文件並輸出每一行。我做錯了什麼，因爲我的代碼輸出每個字母。我怎樣才能將所有的HTML行列入列表？Python - 如何逐行閱讀HTML

這是迄今爲止代碼：

f = open("/home/tony/Downloads/page1/test.html", "r") 
htmltext = f.read() 
f.close() 

for t in htmltext: 
    print t + "\n"

2015-12-15 Lumo5

f.read()將試圖讀取並直到EOF滿足產生每個字符。你想要的是f.readlines()方法：

with open("/home/tony/Downloads/page1/test.html", "r") as f: 
    for line in f.readlines(): 
     print(line) # The newline is included in line

2015-12-15 10:01:17 asadmshah

可以使用f.readlines()而不是f.read()。該函數返回文件中所有行的列表。可以使用list(f)。

f = open("/home/tony/Downloads/page1/test.html", "r") 
f_lines = list(f) 
for line in f_lines: 
    print(line)

2015-12-15 10:12:42 Roccy

回答