2015-02-09 70 views
2

我想在twitter上進行網絡釣魚/垃圾郵件檢測。 我通過Twitter提供的Streaming API獲得了大約500,000條推文。然後,我提取出現在這些推文中的網址,並將它們提交給兩個黑名單 - Google safebrowsing和Phishtanks,以接收關於它是否爲釣魚鏈接的基本判斷。這裏的問題是,根據我的實驗結果,我無法獲取足夠的網絡釣魚推文樣本。 是否有任何已存在的推特數據已被標記爲惡意/正常,以便我可以繼續我的工作?釣魚或垃圾郵件訓練數據

回答

0

黑名單網址無法正常工作,因爲存在延遲。您可以使用暫停的帳戶作爲標籤,但您應該注意,並非所有被暫停的帳戶都是網絡釣魚帳戶。