2017-09-09 22 views
-1

所以即時新的熊貓和im試圖從網頁導入一些數據到我的jupyter筆記本,但是當我導入它時,屬性和數據不能正確排列,我不能對它進行任何操作。我如何修復它,使列標題和數據在同一列?因爲它以這種格式我不能操縱數據。將一個空格分隔的CSV加載到一個熊貓數據框中

這是我試圖導入https://www.stat.berkeley.edu/~statlabs/data/babies.data

+0

如果您的問題得到了充分解決,請[接受](https://stackoverflow.com/help/someone-answers)答案。您還可以從接受答案中獲得聲望。點擊答案旁邊的灰色檢查,直到它變成綠色。 –

回答

0

你的文件的鏈接似乎是空格分隔。您可以使用requests從網頁加載數據io以傳遞緩衝區到df.read_csvdelim_whitespace=True來處理分隔符。

import requests 
import io 
import pandas as pd 

resp = requests.get('https://www.stat.berkeley.edu/~statlabs/data/babies.data') 
df = pd.read_csv(io.StringIO(resp.text), delim_whitespace=True) 

df.columns 
Index(['bwt', 'gestation', 'parity', 'age', 'height', 'weight', 'smoke'], dtype='object') 

df.head() 
Out[749]: 
    bwt gestation parity age height weight smoke 
0 120  284  0 27  62  100  0 
1 113  282  0 33  64  135  0 
2 128  279  0 28  64  115  1 
3 123  999  0 36  69  190  0 
4 108  282  0 23  67  125  1 
相關問題