見層次:遇到問題解析中的Watir-webdriver的這些數據
所有我需要的這裏是「公司名稱」,「公司老闆」,「公司老闆標題」,「街道號碼街道名稱「和」城市,州郵政編碼「。
我試過b.div.span.bs
,但那不起作用(bs
,因爲我收集數據的塊有多個)。我也認爲我只是嘗試像b.tds.split('<br>')
之類的東西,然後替換標籤的所有實例並以某種方式刪除空的數組單元格,但是我發現每個塊都不相同,因此數據不會對齊,即公司標題可能位於單元格中1爲第一個數組,但如果公司標題不存在(對於第二個塊),那麼單元格1將是公司所有者,這是衝突...無論如何,只是試圖找到一個聰明的方式來獲取這些數據。謝謝。
Here是實際的HTML;但是您必須先點擊「查看全部」。
我認爲答案將取決於數據如何變化。你能展示塊的不同變化嗎?您提到公司標題可能不存在,但很難說明HTML佈局的確切含義。哪些其他字段可能是可選的? (如果你可以粘貼HTML而不是截圖,這也會有所幫助 - 這使得我們更容易複製和驗證解決方案。) –
@JustinKo,讓我檢查一下。 – Forwarding
你能給我們一個鏈接的網頁之一?這對於幫助我們提出一個能夠始終如一地工作的解決方案來說非常有幫助。 – JeffC