我只是想刪除HTML標記,然後再保存文件相同的文件.. 的文本文件中的HTML標籤..的Python:修改內容
,但它不工作!我得到的消息....
IOError: [Errno 0] Error
我只是想刪除HTML標記,然後再保存文件相同的文件.. 的文本文件中的HTML標籤..的Python:修改內容
,但它不工作!我得到的消息....
IOError: [Errno 0] Error
我會打開一個文件讀,讀成線及其所有內容的列表,關閉該文件,然後重新打開它上面寫:
for aa in all_firm:
r = open (aa,'r+')
lines = r.readlines()
r.close()
w = open (aa,'w')
for bb in lines:
raw = nltk.clean_html(bb)
raw2=str(raw)
w.write(low_firm)
這是因爲我覺得當它包含文本(而不是寄存器或其他二進制數據)時重寫整個文件比較容易。 差不多總是不是對文本文件的處理很慢,因爲文本文件並不像數據庫文件那麼大。它可能不是更好的解決方案,但我會建議嘗試它。
它的作品!非常感謝! – user976856 2011-12-18 06:19:38
您的文件列表被稱爲low_firm
,但您正在迭代all_firm
。
你寫完它後,你也應該關閉文件。
你的文件列表被稱爲'low_firm'但你迭代'all_firm' – 2011-12-18 05:20:45
你是正確的!謝謝! :) – user976856 2011-12-18 06:03:23