2011-11-21 80 views
0

我在Python中使用pywhois模塊來獲取網站的Whois標頭。雖然它對大多數網站運行良好,但我想了解爲什麼像google.com這樣的網站和其他一些網站用黑色標題返回。 PyWhois僅適用於特定日期後新創建的網站嗎?爲什麼pywhois返回空頭文件?

回答

0

我認爲這與所有的垃圾郵件大牌網站有關。 當你在google.com上運行whois時,你會得到一個沒有任何記錄細節的垃圾清單,我認爲pywhois運行系統whois下面,並將輸入管道輸入到解析器。由於分析器的正則表達式沒有任何細節可以匹配成功,因此它全部變爲空白。如果你這樣做:

x = pywhois.whois('=google.com') 
print x 

你會從所有的垃圾郵件混雜到你的結果中得到更多的信息。我現在也想弄清楚一個解決方法。看着這樣一個問題: https://superuser.com/questions/37954/how-to-use-command-line-whois-for-spam-infected-domains-like-apple-com 我試圖找出如何設置一些選項pywhois運行的這相當於:whois的-h whois-servers.net google.com

Macbook:Sites yellotyellott$ whois google.com 

Whois Server Version 2.0 

Domain names in the .com and .net domains can now be registered 
with many different competing registrars. Go to http://www.internic.net 
for detailed information. 

GOOGLE.COM.ZZZZZZZZZZZZZ.GET.ONE.MILLION.DOLLARS.AT.WWW.UNIMUNDI.COM 
GOOGLE.COM.ZZZZZ.GET.LAID.AT.WWW.SWINGINGCOMMUNITY.COM 
GOOGLE.COM.ZOMBIED.AND.HACKED.BY.WWW.WEB-HACK.COM 
GOOGLE.COM.ZNAET.PRODOMEN.COM 
GOOGLE.COM.YUCEKIRBAC.COM 
GOOGLE.COM.YUCEHOCA.COM 
GOOGLE.COM.WORDT.DOOR.VEEL.WHTERS.GEBRUIKT.SERVERTJE.NET 
GOOGLE.COM.VN 
GOOGLE.COM.VABDAYOFF.COM 
GOOGLE.COM.UY 
GOOGLE.COM.UA 
GOOGLE.COM.TW 
GOOGLE.COM.TR 
GOOGLE.COM.SUCKS.FIND.CRACKZ.WITH.SEARCH.GULLI.COM 
GOOGLE.COM.SPROSIUYANDEKSA.RU 
GOOGLE.COM.SOUTHBEACHNEEDLEARTISTRY.COM 
GOOGLE.COM.SHQIPERIA.COM 
GOOGLE.COM.SERVES.PR0N.FOR.ALLIYAH.NET 
GOOGLE.COM.SAYS.IWANNATSAHEYLUWITHNINAT.COM 
GOOGLE.COM.SA 
GOOGLE.COM.REJSCRAP.COM 
GOOGLE.COM.PEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEENIS.COM 
GOOGLE.COM.PE 
GOOGLE.COM.PAVLINOFF-55-11-44.COM 
GOOGLE.COM.MY 
GOOGLE.COM.MX 
GOOGLE.COM.LASERPIPE.COM 
GOOGLE.COM.IS.NOT.HOSTED.BY.ACTIVEDOMAINDNS.NET 
GOOGLE.COM.IS.HOSTED.ON.PROFITHOSTING.NET 
GOOGLE.COM.IS.APPROVED.BY.NUMEA.COM 
GOOGLE.COM.HK 
GOOGLE.COM.HICHINA.COM 
GOOGLE.COM.HAS.LESS.FREE.PORN.IN.ITS.SEARCH.ENGINE.THAN.SECZY.COM 
GOOGLE.COM.ESJUEGOS.NET 
GOOGLE.COM.DO 
GOOGLE.COM.CO 
GOOGLE.COM.CN 
GOOGLE.COM.BR 
GOOGLE.COM.BITERMANSOLUTIONS.COM 
GOOGLE.COM.BEYONDWHOIS.COM 
GOOGLE.COM.AU 
GOOGLE.COM.AR 
GOOGLE.COM.AFRICANBATS.ORG 
GOOGLE.COM