2015-01-13 67 views
0

我想要從網站中刪除一些數據。但是我遇到了一個問題,即我廢棄的數據類型是字符。我想將其轉換爲數據框,就像您從本網站上看到的一樣。如何在R中讀取字符類型數據作爲數據幀

http://app.finance.ifeng.com/hq/stock_daily.php?code=sh600030

require(RCurl) 
require(rjson) 
library(stringr) 
library(XML) 

url="http://app.finance.ifeng.com/hq/stock_daily.php?code=sh600030" 
SOURCE <- getURL(url,encoding="UTF-8") 
PARSED <- htmlParse(SOURCE) 

k <- xpathSApply(PARSED, "//td",xmlValue) 

回答

0

使用readHTMLTable

url="http://app.finance.ifeng.com/hq/stock_daily.php?code=sh600030" 
SOURCE <- getURL(url,encoding="UTF-8") 
DF <- readHTMLTable(SOURCE)[[1]] 

但你應該得到中國漢字正確的編碼。不知道這個topit是誠實的。

> head(DF) 
     日期 开盘价 最高价 最低价 æ」¶ç›˜ä»·  æˆäº¤é‡  æˆäº¤é¢ æ¶¨è·Œé¢ æ¶¨è·Œå¹… 
1 N 2015-01-13  33.21  33.64  31.77  32.17 6243921<U+624B> 2034644<U+4E07>  -1.36 -4.06% 
2 N 2015-01-12  34.70  35.38  33.23  33.53 6602672<U+624B> 2258232<U+4E07>  -1.43 -4.09% 
3 N 2015-01-09  35.01  36.90  34.41  34.96 7636402<U+624B> 2714229<U+4E07>  -0.29 -0.82% 
4 N 2015-01-08  36.40  36.70  34.68  35.25 6376268<U+624B> 2261846<U+4E07>  -0.90 -2.49% 
5 N 2015-01-07  34.41  37.25  34.29  36.15 7315085<U+624B> 2638717<U+4E07>  1.44  4.15% 
6 2015-01-06  33.80  35.58  33.56  34.71 6681193<U+624B> 2314937<U+4E07>  0.05  0.14% 
+0

但是,這包含一個編碼參數,它不能在shiny.io服務器中使用。 – zhouzilong