我想在HTML文檔中尋找©
,基本上得到版權所歸屬的實體。用正則表達式選擇HTML文本元素?
著作權線顯示了兩種不同的方式:
<p class="bg-copy">© 2011 The New York Times Company</p>
或
<a href="http://www.nytimes.com/ref/membercenter/help/copyright.html">
© 2011</a>
<a href="http://www.nytco.com/">The New York Times Company</a>
或
<br>Published since 1996<br>Copyright © CounterPunch<br>
All rights reserved.<br>
我想忽略日期和中間的標籤和剛剛獲得「紐約時報公司」或「反擊」。
我一直沒有找到很多有關JavaScript或JQuery使用正則表達式,雖然我覺得它可能會導致重大的麻煩。如果有更好的方法,請告訴我。
測試不要使用正則表達式,而不是使用DOM樹找到你在找什麼。一些鏈接:http://www.howtocreate.co.uk/tutorials/javascript/dombasics – FailedDev
通常你會得到的迴應是 - 請不要使用正則表達式進行JS解析。使用JS解析器。問題是 - 你能嗎? – ZenMaster
@FailedDev差點讓它... – ZenMaster