我有一些問題使用Xpath獲取所有沒有<script>
或<script ... />
的html標籤。XPATH獲取所有標籤<script>和</script>標籤
例如,在HTML代碼中的這一部分,我想刪除:
<script type="text/javascript" src="http://www.google.com/coop/cse/brand?form=cse-search-box&lang=fr"/>
此代碼
<li><!-- Search Google -->
<center>
<form action="http://www.google.fr/cse" id="cse-search-box" target="_blank">
<div>
<input type="hidden" name="cx" value="partner-pub-0959382714089534:mw3ssl65jk1"/>
<input type="hidden" name="ie" value="ISO-8859-1"/>
<input type="text" name="q" size="31"/>
<input type="submit" name="sa" value="Rechercher"/>
</div>
</form>
<script type="text/javascript"
src="http://www.google.com/coop/cse/brand?form=cse-search-box&lang=fr"/>
</center>
<!-- Search Google --></li>
我生成使用Web-收穫一個XML文件,那麼我必須刪除一些特定的標籤。 我已經嘗試了很多的XPath(我在HTML的主體工作):
//body//*[not(name() = 'script')]
//body//*[not(self::script)]
//body//*[not(starts-with(name(),'script'))]
//body//*[not(contains(name(),'script'))]
但它不工作。
注意//body//*[name() = 'script']
工作,但我想相反...
你有一些想法?
或者更generaly,如果你知道如何刪除使用XPath所有<script>
<script/>
標籤,我也是提前
感謝:-)興趣。
好問題,+1。請參閱我的答案,解釋爲什麼僅使用XPath和完整,簡短且容易的XSLT解決方案無法實現此目的。 :) – 2011-04-21 02:54:20