這是我的html:如何用python熊貓的read_html讀取多個tbody的html表格?
import pandas as pd
html_table = '''<table>
<thead>
<tr><th>Col1</th><th>Col2</th>
</thead>
<tbody>
<tr><td>1a</td><td>2a</td></tr>
</tbody>
<tbody>
<tr><td>1b</td><td>2b</td></tr>
</tbody>
</table>'''
如果我運行df = pd.read_html(html_table)
,然後print(df[0]
我得到:
Col1 Col2
0 1a 2a
西2消失。爲什麼?如何預防它?
的HTML不是我的代碼。我可能會用Beautifulsoup讀取html,並在用熊貓閱讀之前刪除所有的tbodies。 – foebu