我有一個程序的HTML表格輸出,它將單元格內的值與<br>
分開。我嘗試過使用XML::readHTMLTable
和htmltab
,但他們一起貶低沒有任何分隔符的值。我需要用逗號分隔,但我沒有看到這些函數的任何論點來解釋這一點。我已經發布了一個僞文件的例子。目前它讀入兩個載體c("ABC","DEF","GHI")
和c("JKLMNO","PQR","STU")
,但我需要"JKLMNO"
元素來代替"JKL,MNO"
。如何讀取HTML表格並計算單元格內的換行符
<table>
<tr>
<td>
ABC<br/>
</td>
<td>
DEF<br/>
</td>
<td>
GHI<br/>
</td>
</tr>
<tr>
<td>
JKL<br/>
MNO<br/>
</td>
<td>
PQR<br/>
</td>
<td>
STU<br/
</td>
</tr>
</table>
可能的重複..http://stackoverflow.com/questions/1395528/scraping-html-tables-into-r-data-frames-using-the-xml-package – user5249203