獲取使用XPath

-1

屬性

考慮HTML結構，像這樣：獲取使用XPath

<dd itemprop="actors"> 
    <span itemscope="" itemtype="http://schema.org/Person"> 
     <a itemprop="name">Yumi Kazama</a>,     </span> 

<span itemscope="" itemtype="http://schema.org/Person"> 
    <a itemprop="name">Yuna Mizumoto</a>,    </span> 

<span itemscope="" itemtype="http://schema.org/Person"> 
    <a itemprop="name">Rei Aoki</a>,      </span> 
</dd>

如何獲得的a/text()所有價值，爲所有itemprop="name"元素？

網址：

//*[@itemprop='actors']//*[@itemprop='name']/text()

越來越僅第一a/text。

來源

2016-08-03 Jin

只看發佈的鏈接OP，這似乎是極不恰當或這個論壇甚至辱罵。我正在標記這一點。其他人，如果有的話，引起關注 – SomeDude

你的xpath工作正常 –

假設你的HTML文件的test.html下面應該工作：

from lxml import html 

with open(r'E:/backup/GoogleDrive/py/scrapy/test.html', "r") as f: 
    page = f.read() 
tree = html.fromstring(page) 
names = tree.xpath("//a[@itemprop='name']//text()") 
print names

來源

2016-08-03 19:19:10

回答

相關問題