我試圖在我的apache訪問日誌中找到任何空白的用戶代理和欺騙用戶代理的痕跡。在訪問日誌中查找空白的用戶代理和欺騙UA
下面是從我的訪問日誌的典型線路:(IP和域名節錄)
x.x.x.x - - [10/Nov/2012:16:48:38 -0500] "GET /YLHicons/reverbnation50.png HTTP/1.1" 304 - "http://www.example.com/newaddtwitter.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/534.7 ZemanaAID/FFFF0077"
爲空的用戶代理我試圖做到這一點:
awk -F\" '($6 ~ /^-?$/)' /www/logs/www.example.com-access.log | awk '{print $1}' | sort | uniq
爲了找到有關信息UA的我運行此:(給我的每一個獨特的UA具有點擊量)
awk -F\" '{print $6}' /www/logs/www.example.com-access.log | sort | uniq -c | sort -fr
我能做些什麼不同到m讓這些命令更強大,更深思熟慮,同時給我提供最好的信息來打擊互聯網上的機器人和其他渣滓?
對不起,遲到了,但這很酷。絕對得到書籤以供將來使用。謝謝! –