標記通過網站發送的詐騙電子郵件的算法

因此，我有一個ASP.NET MVC 3網站，它允許人們爲銷售某些物品做廣告。一般公衆可以來到網站並瀏覽廣告。在每個廣告的詳細信息頁面上都有一個表格，您可以在不必創建帳戶的情況下對廣告進行回覆。標記通過網站發送的詐騙電子郵件的算法

我最近一直從一些用戶，他們正在接受廣告的反應，如「我很感興趣，該項目的抱怨，請我會送你一個收銀員爲$ 2,000美元的金額在檢查你的要價......「等等你都看過這個騙局。

我希望能夠讓廣告響應表單可供人們使用，而不必創建一個帳戶（這只是一個障礙），但同時實施任何安全措施，我可以打擊這種東東。

所以我的問題是：人們對這樣的事情有什麼建議？我已經實施了CAPTCHA，並限制了IP地址在特定時間段內可以提交的廣告回覆數量。根據廣告的類型，我沒有看到合法使用該網站的人會超出限制，但這會導致垃圾郵件發送者必須坐下來等待，然後才能發送另一個騙局，以便他們的時間在其他地方更好。

什麼其他「幕後」算法有人使用？我正在考慮比較同一人的反應，如果他們有一定的百分比匹配則拒絕他們（所以你不能複製/粘貼完全相同的響應時間）。

是否建立了檢查電子郵件內容與某種「騙局詞典」以查看電子郵件內容是否構成騙局的方法？如果我能檢測到這一點，我可以在發佈給客戶之前將電子郵件標記爲審覈。

這些只是我的一些想法，但我很想知道別人已經實現了什麼。我在C＃中工作，所以如果有人想提供他們所做的樣本，那也可能是有用的。

順便說一句 - 不知道如何將其轉換爲wiki，但它似乎可能更適合我問的類型的問題。

2011-08-30 Scott

你可以讓你的用戶標識的郵件爲垃圾郵件，然後使用您的信息作爲訓練語料庫一個學習系統 - 例如，通過使用谷歌的Prediction API。

2011-09-05 02:47:46

爲了能夠正常工作，您需要一個有代表性的已知好消息語料庫來進行訓練（否則系統會認爲「和」和「to」是最好的垃圾郵件指示器！垃圾郵件通常只有幾千個樣本，但如果您要篩選少量重複違規者，則幾十到幾百個樣本應該足以讓您入門。 – tripleee

@tripleee Yup - 你需要養活「火腿」和「垃圾郵件」信息，而不僅僅是被標記的信息！ –

有數據庫，可幫助識別垃圾郵件，例如參見服務的Akismet：

2011-08-30 14:51:08 ColinE

Akismet看起來不錯，但我不知道它是如何可行的檢查電子郵件。似乎更多的是針對評論/引用垃圾郵件。另外，閱讀一些評論，看起來有很多潛在的誤報，儘管這些評論是幾年前的。雖然可能值得一試。 – Scott

使用自動分類器時，誤報始終是可能的。 –

回答