0
我使用Python和imaplib從IMAP服務器獲取電子郵件(支持各種IMAP服務器 - GMail等)。IMAP HTML文本中的額外選項卡
我的問題是:使用IMAP BODY [INDEX]命令來獲取特定的正文部分,HTML帶有額外的選項卡。如:
(...)</a>\t\t\t\t\t\t\t\t<a>(...)
顯示HTML當標籤顯然是多餘的。
(截圖是在葡萄牙的語言,但我認爲是不相關的
我已經搜索了IMAP文檔,但沒有發現任何有用的信息,我猜這些\ t總是跟着標籤關閉(比如\ t \ t \ t \ t \ t),所以我只能找到標籤關閉後出現的所有標籤刪除它們,但我不知道這是否會是可靠的方法。
謝謝
請向我們展示處理相關文本的代碼。 – 2013-05-06 21:05:50
製表符對html解析器不重要。他們可能在源文件中。 Html摺疊所有相鄰的空格,包括製表符到一個空格。 – Max 2013-05-07 00:09:56