2015-11-19 41 views
0

我試圖提取使用XPath從URL中的地址一樣的XPath不同的節點號

https://www.americangemsociety.org/bradshaw-s-jewelers https://www.americangemsociety.org/fincher-ozment-jewelers

然而,問題是地址的位置不統一整個頁面。一些頁面在段落節點#4上具有地址,而另一些在段落節點#2上具有它們,等等。

我在想,如果我可以使用識別基於地址,而不是特定的節點#的HTML

<p><strong class="">Address:</strong> 4355 Montgomery Hwy, Ste 2, Dothan, Alabama 36303-1696</p> 

內地址的

例中的「強類的地址的XPath請告知

感謝

回答

1

如果使用//p[strong[not(normalize-space(@class)) and . = 'Address:']]然後可以選擇所有p元件,其續包含內容​​的strong元素。

+0

非常感謝您的回答,馬丁。這工作完美。 –