2011-08-30 52 views
2

因此,我有一個ASP.NET MVC 3網站,它允許人們爲銷售某些物品做廣告。一般公衆可以來到網站並瀏覽廣告。在每個廣告的詳細信息頁面上都有一個表格,您可以在不必創建帳戶的情況下對廣告進行回覆。標記通過網站發送的詐騙電子郵件的算法

我最近一直從一些用戶,他們正在接受廣告的反應,如「我很感興趣,該項目的抱怨,請我會送你一個收銀員爲$ 2,000美元的金額在檢查你的要價......「等等你都看過這個騙局。

我希望能夠讓廣告響應表單可供人們使用,而不必創建一個帳戶(這只是一個障礙),但同時實施任何安全措施,我可以打擊這種東東。

所以我的問題是:人們對這樣的事情有什麼建議?我已經實施了CAPTCHA,並限制了IP地址在特定時間段內可以提交的廣告回覆數量。根據廣告的類型,我沒有看到合法使用該網站的人會超出限制,但這會導致垃圾郵件發送者必須坐下來等待,然後才能發送另一個騙局,以便他們的時間在其他地方更好。

什麼其他「幕後」算法有人使用?我正在考慮比較同一人的反應,如果他們有一定的百分比匹配則拒絕他們(所以你不能複製/粘貼完全相同的響應時間)。

是否建立了檢查電子郵件內容與某種「騙局詞典」以查看電子郵件內容是否構成騙局的方法?如果我能檢測到這一點,我可以在發佈給客戶之前將電子郵件標記爲審覈。

這些只是我的一些想法,但我很想知道別人已經實現了什麼。我在C#中工作,所以如果有人想提供他們所做的樣本,那也可能是有用的。

順便說一句 - 不知道如何將其轉換爲wiki,但它似乎可能更適合我問的類型的問題。

回答

2

你可以讓你的用戶標識的郵件爲垃圾郵件,然後使用您的信息作爲訓練語料庫一個學習系統 - 例如,通過使用谷歌的Prediction API

+0

爲了能夠正常工作,您需要一個有代表性的已知好消息語料庫來進行訓練(否則系統會認爲「和」和「to」是最好的垃圾郵件指示器!垃圾郵件通常只有幾千個樣本,但如果您要篩選少量重複違規者,則幾十到幾百個樣本應該足以讓您入門。 – tripleee

+0

@tripleee Yup - 你需要養活「火腿」和「垃圾郵件」信息,而不僅僅是被標記的信息! –

1

有數據庫,可幫助識別垃圾郵件,例如參見服務的Akismet:

http://akismet.com/

+0

Akismet看起來不錯,但我不知道它是如何可行的檢查電子郵件。似乎更多的是針對評論/引用垃圾郵件。另外,閱讀一些評論,看起來有很多潛在的誤報,儘管這些評論是幾年前的。雖然可能值得一試。 – Scott

+0

使用自動分類器時,誤報始終是可能的。 –