我使用這個XPath來獲取文本()後面的mailto:XPath表達式不能提取的mailto:屬性
//a[starts-with(@href, 'mailto')]/text()
現在我希望能夠提取什麼來後mailto:
爲這樣的屬性:
<a href="mailto:[email protected]?subject=hello">here</a>
我想:[email protected]?subject=hello
XPath的什麼我應該用得到的字符串Ĵ ust後的mailto:?
編輯:似乎是mailto:正在使用JavaScript生成。 scrapy可以處理這樣的事情嗎?
<script type="text/javascript">
<!--
var prefix = 'ma' + 'il' + 'to';
var path = 'hr' + 'ef' + '=';
var addy54802 = 'info' + '@';
addy54802 = addy54802 + 'zlango' + '.' + 'com?subject=Career%20at%20Zlango';
var addy_text54802 = 'here';
document.write('<a ' + path + '\'' + prefix + ':' + addy54802 + '\'>');
document.write(addy_text54802);
document.write('<\/a>');
//-->\n </script>
解決方案:我想我應該使用Selenium for javascript。
爲什麼你就不能得到的那部分你整個HREF後,剛剛參加站長後,從字符串 – iblazevic 2012-07-27 07:48:00
第一個問題是:你如何獲得屬性的*值*?我不知道,所以我刪除了我的錯誤答案。 – 2012-07-27 08:01:01
看到我的編輯上面 – DjangoPy 2012-07-27 08:09:29