2012-09-19 47 views
3

我想處理傳入電子郵件(上IMAP帳戶),爲電子郵件獲取客戶端和進料的電子郵件數據轉換成一種腳本語言來填充數據庫中的特定表。主要目標是處理用於數據挖掘和指標的電子郵件正文文本。動態處理傳入電子郵件數據與腳本語言 - >數據庫

最好的,如果像系統上常見的UNIX上運行:Linux的,* BSD,的Solaris

Infrastructure: 

Mail Server <---using-IMAP--client<--- My Server--> Scripting lang. -> Database 

我發現迄今:

任何可能用於執行此類任務的建議?

+0

可能的重複http://stackoverflow.com/questions/2301213/how-to-efficiently-parse-emails-without-touching-attachments-using-python –

+0

我使用fetchmail,procmail。 。procmailrc然後進一步處理使用PHP腳本。不是最快的解決方案,但易於維護和增強恕我直言。 – dklt

回答

4

對於Python,imaplib實現IMAP4客戶端。

這和納爾遜的答案應該給你模板遵循:

  1. 選擇您希望您的服務器上使用的腳本語言。
  2. 它是否具有IMAP客戶端庫,擴展或內置功能?
  3. 它是否有連接到你想要使用的特定數據庫(MySQL,Postgres,MSSQL等)?
  4. 如果答案(2)或(3)是 「否」,回到步驟1
  5. ...
  6. 利潤!
1

你可以使用php-imap從PHP連接到IMAP帳戶,檢索電子郵件,搜索消息,刪除它,當然它保存到數據庫中。

2

有了這個做我自己,我用Python和imaplib。定期輪詢IMAP服務器以查找和檢索新郵件。就這麼簡單。簡單是引號,因爲您需要了解IMAP協議才能使用imaplib。

或者,您可以編寫一個使用context.io API的腳本。如果你這樣做,你可以在學習IMAP的複雜性方面節省一些痛苦。

如果您有能力自動將電子郵件從郵件服務器轉發到另一個地址,那麼您可以考慮將您的電子郵件轉發到像SendGrid的Parse API或Mailgun這樣的服務,該服務會爲您處理電子郵件並通過API調用(通常比IMAP更容易理解)。

至於數據庫,我發現MongoDB super易於使用pymongo庫連接到Python。