2016-08-21 34 views
0

我是新來的python,並有一個簡單的問題。在第一步中,我想加載一些我在Stata中創建的示例數據。在第二步中,我想描述python中的數據 - 也就是說,我想要一個導入的變量名稱列表。到目前爲止,我已經做到了這一點:如何通過熊貓導入.dta並描述數據?

from pandas.io.stata import StataReader 

reader = StataReader('sample_data.dta') 
data = reader.data() 

dir() 

我得到以下錯誤:

anaconda/lib/python3.5/site-packages/pandas/io/stata.py:1375: UserWarning: 'data' is deprecated, use 'read' instead 
    warnings.warn("'data' is deprecated, use 'read' instead") 

是什麼意思,我怎樣才能解決這個問題?並且,dir()是理解我在數據中具有哪些變量的正確方法?

回答

1

使用pandas.io.stata.StataReader.datastata中讀取文件已在pandas 0.18.1版本中被棄用,因此您會收到該警告。

相反,你必須使用pandas.read_stata讀取文件,如下所示:

df = pd.read_stata('sample_data.dta') 
df.dtypes          ## Return the dtypes in this object 
+0

感謝我用'進口pandas'和你建議的命令。但是,df.dtyps不會返回數據類型。任何暗示爲什麼? – Rachel

+1

您必須在它之前添加一個'print'語句。 –

+0

完美,作品!謝謝!我希望,我現在可以使用變數。我可以簡單地通過名稱來調用變量,還是必須先指定它們? – Rachel