2010-02-11 25 views

回答

5

它們是數字character entities,試圖欺騙蜘蛛,使其看不到電子郵件地址形式的「mailto」或字符。而作爲一種反收穫策略,它可能從1997年左右開始無效。 :-)

+0

由於大多數語言現在都有像PHP的html_entity_decode()這樣的本地函數,它們可以在這些實體和真實字符之間進行匹配,所以還沒有工作。 – jpabluz 2010-02-11 14:52:58

+0

@jpabluz:的確如此。蜘蛛解釋實體,然後掃描結果字符串。 – 2010-02-11 14:53:58

0

此:

<a href="&#109;&#x61;... &#111;&#x6d;">&#x63;&#x74;... e&#115;&#x73;</a> 

使得用於電子郵件收穫比其對應部件也有點困難:

<a href="mailto:[email protected]'>contact</a> 

然而,也有辦法,甚至解密所以這不是在實踐中非常有用:(

1

它假定spambot蜘蛛把網頁作爲文本對待正則表達式匹配而不是執行最基本的HTML解析