我試圖刪除這兩個分隔符之間的文本:'<'&'>'。我正在閱讀電子郵件內容,然後將該內容寫入.txt文件。我在這兩個分隔符之間得到了很多垃圾,包括我的.txt文件中的行之間的空格。我如何擺脫這一點?下面是我的腳本已經從寫我的.txt文件讀入數據:如何在包含空行的兩個分隔符之間剝離文本?
First Name</td>
<td bgcolor='white' style='padding:5px
!important;'>Austin</td>
</tr><tr>
<td bgcolor='#f9f9f9' style='padding:5px !important;'
valign='top' width=170>Last Name</td>
下面是我目前從它剝離了空行.txt文件讀取代碼:
# Get file contents
fd = open('emailtext.txt','r')
contents = fd.readlines()
fd.close()
new_contents = []
# Get rid of empty lines
for line in contents:
# Strip whitespace, should leave nothing if empty line was just "\n"
if not line.strip():
continue
# We got something, save it
else:
new_contents.append(line)
for element in new_contents:
print element
這裏是預計什麼:
First Name Austin
Last Name Jones
您可以爲您的示例發佈您的預期輸出嗎? –
同上@ Farhan.K,但增加了一些輸入/預期/有doohickeys(技術術語) – Blacksilver
名\t \t奧斯汀\t \t 姓\t \t瓊斯 –