0
我想提取一個網頁中使用python硒的鏈接列表。所有網頁上的鏈接在源代碼的格式如下:Python的硒Webdriver - 定位表中的元素集
<a href = "link"></a>
使用下面的行給了我所有的頁面上的標籤名a
元素:
driver.find_elements_by_tag_name("a")
的問題是,我只需要一組特定的鏈接,並且所有這些鏈接都在一張表內。上面的代碼爲我提供了頁面上的所有鏈接,甚至包括桌面外的所有鏈接。網頁源代碼的輪廓看起來是這樣的:
<html>
...
...
<frame name = "frame">
<a href = "unwantedLink">
<form name = "form">
<table name = "table">
<a href = "link1">
<a href = "link2">
<a href = "link3">
</table>
</form>
</frame>
...
</html>
我需要link1
,link2
和link3
,但不unwantedLink
。所需鏈接和不需要的鏈接都在同一個框架中,所以切換框架將不起作用。有沒有辦法在表格內尋找標籤名稱a
,但不在父框架內?
感謝