1
我試圖從維基URL中提取奧運獎牌表,併爲此使用Python熊貓。熊貓read_html檢索表
import pandas as pd
url = 'https://en.wikipedia.org/wiki/All-time_Olympic_Games_medal_table'
df = pd.read_html(url, skiprows=7, header = None)
df[0]
不過,我失去了5行這些都是
名
阿富汗(AFG)阿爾及利亞(ALG)
阿根廷(ARG)
亞美尼亞(ARM)
一旦我設置skiprows = 0 - 6將返回災難表框架,所以至少我必須設置skiprows爲6.
是否有任何天賦推薦任何技巧檢索完美表,而不是手動插入行?
感謝