我們正在解析一個郵件列表(Mailman)的電子郵件收件箱,該郵件列表除了坐在郵件列表中並從其他用戶那裏收集郵件外,什麼也不做。這將會是PHP連接到一個電子郵箱,抓取新的電子郵件並將它們放入MySQL數據庫中,以用作可搜索的Web檔案。按主題排列電子郵件
我注意到許多主題在他們面前(很明顯)都有RE:FW:FWD,但是想知道如果在輸出數據庫結果到數據庫結果時不需要手動去掉這些數據網頁。
也許有一個PHP/Mail或PEAR類會自動處理我不知道的消息分組/線程。謝謝你的幫助!
我們正在解析一個郵件列表(Mailman)的電子郵件收件箱,該郵件列表除了坐在郵件列表中並從其他用戶那裏收集郵件外,什麼也不做。這將會是PHP連接到一個電子郵箱,抓取新的電子郵件並將它們放入MySQL數據庫中,以用作可搜索的Web檔案。按主題排列電子郵件
我注意到許多主題在他們面前(很明顯)都有RE:FW:FWD,但是想知道如果在輸出數據庫結果到數據庫結果時不需要手動去掉這些數據網頁。
也許有一個PHP/Mail或PEAR類會自動處理我不知道的消息分組/線程。謝謝你的幫助!
線程的正確方法不是按主題,而是由Message-ID
和References
標題。 References
標題將包含所有以前相關的Messgage-ID
標題的以逗號分隔的字符串。通過使用這些,主題行的實際內容變得不太重要,因爲它可能會被修改和損壞。在其他情況下,您可能會獲得許多單獨的線索,其中包含「不需要幫助」的主題,而不應將它們串聯在一起。
您可能想要查看References
和In-Reply-To
電子郵件標題。這些信息會告訴您當前電子郵件正在回覆哪些電子郵件。
有基於此信息一個好的算法爲主題電子郵件:http://www.jwz.org/doc/threading.html
非常有幫助。萬分感謝! – 2011-06-06 16:35:27