釣魚或垃圾郵件訓練數據

我想在twitter上進行網絡釣魚/垃圾郵件檢測。我通過Twitter提供的Streaming API獲得了大約500,000條推文。然後，我提取出現在這些推文中的網址，並將它們提交給兩個黑名單 - Google safebrowsing和Phishtanks，以接收關於它是否爲釣魚鏈接的基本判斷。這裏的問題是，根據我的實驗結果，我無法獲取足夠的網絡釣魚推文樣本。是否有任何已存在的推特數據已被標記爲惡意/正常，以便我可以繼續我的工作？釣魚或垃圾郵件訓練數據

來源

2015-02-09 Charlotte

黑名單網址無法正常工作，因爲存在延遲。您可以使用暫停的帳戶作爲標籤，但您應該注意，並非所有被暫停的帳戶都是網絡釣魚帳戶。

來源

2016-06-27 12:19:06

釣魚或垃圾郵件訓練數據

回答

相關問題