2016-12-07 27 views
1

我正在使用import.io爲newegg.com編寫提取器。從上市頁面獲取價格值時,我面臨一個難題。如何使用import.io在一列中連接兩個值

<div class="item-price-now"> 
    <span>from</span> 
    $ 
    <strong>108</strong> 
    <sup>.00</sup> 
    </div> 

價格包含在兩個節點,SUP。我想要得到108.00作爲一個節點。當我嘗試跟蹤Xpath時,我得到兩個節點中的值。

//div[@class="item-price-now"]//strong/text() | //div[@class="item-price-now"]//sup/text() 

在此先感謝。

回答

2

您可以使用xpath來獲取div內的所有文本,然後使用正則表達式將其僅過濾到美元之後的文本。

的XPath://div[@class='item-price-now'] - >from $108.00

正則表達式:\$d+\.\d+ - >$108.00

+1

它的工作原理。謝謝 – user2989777