0
我想從給定的網頁導入數據到R,例如this one。從html源碼讀取XML數據到R
在源代碼中(但不是實際的頁面上),我想獲得的數據存儲在JavaScript代碼的單一線,開始是這樣的:
chart_Line1.setDataXML("<graph rotateNames (stuff omitted) >
<set value='699.99' name='16.02.2013' />
<set value='731.57' name='18.02.2013' />
<set value='more values' name='more dates' />
...
<trendLines> (now a different command starts, stuff omitted)
</trendLines></graph>")
(請注意,我爲了便於閱讀,我們使用了換行符;數據在原始文件中只有一行,只需要導入以chart_Line1.setDataXML開頭的行 - 如果您想自己查看,那麼在源代碼中是第56行)
我可以使用scan("URLofFile", what="raw")
將整個html文件讀入字符串,但是如何從中提取數據?
我可以使用what="..."
指定數據格式,請記住沒有換行符來分隔數據,但在不相關的前綴和後綴中有幾個換行符?
這是可以用R工具以很好的方式完成的東西,還是您建議這個數據採集應該使用不同的腳本來完成?