-1
所以即時新的熊貓和im試圖從網頁導入一些數據到我的jupyter筆記本,但是當我導入它時,屬性和數據不能正確排列,我不能對它進行任何操作。我如何修復它,使列標題和數據在同一列?因爲它以這種格式我不能操縱數據。將一個空格分隔的CSV加載到一個熊貓數據框中
這是我試圖導入https://www.stat.berkeley.edu/~statlabs/data/babies.data
所以即時新的熊貓和im試圖從網頁導入一些數據到我的jupyter筆記本,但是當我導入它時,屬性和數據不能正確排列,我不能對它進行任何操作。我如何修復它,使列標題和數據在同一列?因爲它以這種格式我不能操縱數據。將一個空格分隔的CSV加載到一個熊貓數據框中
這是我試圖導入https://www.stat.berkeley.edu/~statlabs/data/babies.data
你的文件的鏈接似乎是空格分隔。您可以使用requests
從網頁加載數據io
以傳遞緩衝區到df.read_csv
和delim_whitespace=True
來處理分隔符。
import requests
import io
import pandas as pd
resp = requests.get('https://www.stat.berkeley.edu/~statlabs/data/babies.data')
df = pd.read_csv(io.StringIO(resp.text), delim_whitespace=True)
df.columns
Index(['bwt', 'gestation', 'parity', 'age', 'height', 'weight', 'smoke'], dtype='object')
df.head()
Out[749]:
bwt gestation parity age height weight smoke
0 120 284 0 27 62 100 0
1 113 282 0 33 64 135 0
2 128 279 0 28 64 115 1
3 123 999 0 36 69 190 0
4 108 282 0 23 67 125 1
如果您的問題得到了充分解決,請[接受](https://stackoverflow.com/help/someone-answers)答案。您還可以從接受答案中獲得聲望。點擊答案旁邊的灰色檢查,直到它變成綠色。 –