1
我在Microsoft Outlook中收到一封包含html表的郵件。我想解析一下熊貓的數據框。以html格式閱讀outlook郵件
我已經寫了一個腳本,使用美麗的湯來解析HTML文本到數據框中。但我首先在閱讀html中的電子郵件時感到很困難。
找到消息我正在使用下面的代碼將其讀入到文本文件中。但它正在將文本寫成一個/ n分隔的字符串,而不是像我期待的那樣的數據。這意味着我不能使用美麗的湯將其轉化爲數據框。
我發現了很多關於如何編寫和發送html郵件的例子,但沒有發現如何以html格式讀取。有任何想法嗎?
contents = msg.Body.encode('ascii', 'ignore').decode('ascii')
contents_file = open("U:\body.txt", "w")
contents_file.write(contents)
contents_file.close()