我有以下HTML,並且我需要獲取粗體標記之外的文本。例如「提交時間:」我需要獲取後面的時間戳。您會看到'提交時間:被大膽標記包圍,時間戳記如下,我無法檢索它。如何使用watir webdriver檢索innerhtml
<body>
<h2> … </h2>
<b> … </b>
jenkins
<br></br>
<b> … </b>
<br></br>
<b> … </b>
<a href=""> … </a>
<br></br>
<b> … </b>
<br></br>
<b>
Submitted At:
</b>
29-Jan-2016 17:12:24
我試過的東西。
@ browser.body.text.split( 「\ n」 個)
@ browser.body.split( 「\ n」 個)
body_html =引入nokogiri :: HTML.parse(@browser。 。body.html)
body_html.xpath( 「// //身體b」)文本
- 返回:「用戶:作業名:JobConf:工作的ACL:所有用戶都allowedSubmitted在:在推出:完成時間:狀態:分析此作業「
我已經嘗試過幾種方法,比如xpath,普通的舊文本檢索,但是我無法得到我需要的東西。我也做過幾次搜索,找不到我需要的東西。
它看起來很脆弱和跛腳,但你可以鏈'String :: scan'來拉時間戳。構造示例:'b.text.scan(/ \ d。* \ d /)' – orde
請閱讀「[問]」,包括底部的鏈接和「[mcve]」。我們需要看到你試圖解決問題,否則它看起來像你想讓我們爲你寫代碼。 –
你可能會更好,只是將它解析爲一個巨大的字符串。 upvoting只是爲了防止新用戶失去業力。也投票結束 –