因此,我有一個ASP.NET MVC 3網站,它允許人們爲銷售某些物品做廣告。一般公衆可以來到網站並瀏覽廣告。在每個廣告的詳細信息頁面上都有一個表格,您可以在不必創建帳戶的情況下對廣告進行回覆。標記通過網站發送的詐騙電子郵件的算法
我最近一直從一些用戶,他們正在接受廣告的反應,如「我很感興趣,該項目的抱怨,請我會送你一個收銀員爲$ 2,000美元的金額在檢查你的要價......「等等你都看過這個騙局。
我希望能夠讓廣告響應表單可供人們使用,而不必創建一個帳戶(這只是一個障礙),但同時實施任何安全措施,我可以打擊這種東東。
所以我的問題是:人們對這樣的事情有什麼建議?我已經實施了CAPTCHA,並限制了IP地址在特定時間段內可以提交的廣告回覆數量。根據廣告的類型,我沒有看到合法使用該網站的人會超出限制,但這會導致垃圾郵件發送者必須坐下來等待,然後才能發送另一個騙局,以便他們的時間在其他地方更好。
什麼其他「幕後」算法有人使用?我正在考慮比較同一人的反應,如果他們有一定的百分比匹配則拒絕他們(所以你不能複製/粘貼完全相同的響應時間)。
是否建立了檢查電子郵件內容與某種「騙局詞典」以查看電子郵件內容是否構成騙局的方法?如果我能檢測到這一點,我可以在發佈給客戶之前將電子郵件標記爲審覈。
這些只是我的一些想法,但我很想知道別人已經實現了什麼。我在C#中工作,所以如果有人想提供他們所做的樣本,那也可能是有用的。
順便說一句 - 不知道如何將其轉換爲wiki,但它似乎可能更適合我問的類型的問題。
爲了能夠正常工作,您需要一個有代表性的已知好消息語料庫來進行訓練(否則系統會認爲「和」和「to」是最好的垃圾郵件指示器!垃圾郵件通常只有幾千個樣本,但如果您要篩選少量重複違規者,則幾十到幾百個樣本應該足以讓您入門。 – tripleee
@tripleee Yup - 你需要養活「火腿」和「垃圾郵件」信息,而不僅僅是被標記的信息! –