2017-01-14 56 views
-1

我想從這個網頁刮數據廢棄數據:http://webfund6.financialexpress.net/clients/zurichcp/PortfolioPriceTable.aspx?SchemeID=33,我特別需要的數據爲基金數量的26的XPath從第二頁

都沒有問題從第一頁中獲取數據與該地址(基金編號1-25),但因爲我的地獄不能從第二頁上刮掉任何東西。有人可以幫忙嗎?

謝謝!

這裏是我使用的代碼:在谷歌表:

= IMPORTXML( 「http://webfund6.financialexpress.net/clients/zurichcp/PortfolioPriceTable.aspx?SchemeID=33」,「/ HTML /體/形式[@ ID = '的MainForm'] /表/ TR/TD/DIV [ @ ID = '主'] /格[@ ID = 'tabResult'] /格[@ ID = '價格'] /表/ THEAD/TR [26]/TD [@類= '中心'] [1]」 )

回答

0

你可以做兩件事情 - 一個是爲PgIndex=2添加到您的URL的末尾,然後你也可以顯著簡化您的XPath來此:

//*[@id='Prices']//tr[2]/td[2] 

這特別是抓取表的第二行(tr表示錶行),以繞過標題行,然後抓取表格數據單元的第二個字段。

=IMPORTXML("http://webfund6.financialexpress.net/clients/zurichcp/PortfolioPriceTable.aspx?SchemeID=33&PgIndex=2","//*[@id='Prices']//tr[2]/td[2]") 

enter image description here

+0

Aurielle,非常感謝! – Mordko

0

要獲得第二頁,請在您的網址中添加& PgIndex = 2。然後將/ table/thead/tr [26]調整到/ table/thead/tr [2]。其結果是:

=IMPORTXML("http://webfund6.financialexpress.net/clients/zurichcp/PortfolioPriceTable.aspx?SchemeID=33&PgIndex=2","/html/body/form[@id='MainForm']/table/tr/td/div[@id='main']/div[@id='tabResult']/div[@id='Prices']/table/thead/tr[2]/td[@class='Center'][1]") 
+0

版,非常感謝!我一直在努力與這個愚蠢的東西多年,你真的幫了忙。 – Mordko

+0

太棒了!如果這回答了您的問題,請批准答案。謝謝, –