2017-08-07 137 views
0

我有一個csv文件,並且正在嘗試創建一個數據集以便與scikit-learn一起使用。如何從本地csv文件創建一個python數據集?

加載這些包:

import matplotlib.pyplot as plt 
import pandas as pd 
import numpy as np 
from sklearn import datasets, linear_model 

我嘗試這樣做:

sales = pd.read_csv("sales.csv") 
dataset = np.loadtxt(sales, delimiter=",") 

它給了我這個錯誤:

AttributeError: 'DataFrame' object has no attribute 'endswith'

請幫幫忙!我無法找到如何從csv文件創建數據集。

謝謝!

編輯

爲了澄清 - 我儘量遵循這一程序http://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html,但我想用我自己的數據。我想知道如何將csv轉換爲python數據集,如果甚至可能的話。

+0

請參閱此文檔https://docs.scipy.org/doc/numpy-1.10.4/reference/generated/numpy.loadtxt.html,可能有助於設置您的'dtype'。 –

回答

0

基本上,銷售已經是數據集。您正嘗試傳遞一個數據框對象來代替文件名。因此,您可以使用直接銷售的數據集,因爲它將包含的功能和標籤或

dataset = np.loadtxt('sales.csv', delimiter=",") 

兩種方式均有效,如果您對數據的正確格式。

0

在您的情況下,銷售是您可能正在尋找的DataFrame。你可以操縱它,例如嘗試打印sales.columns。

+0

我真的不明白如何解決這個問題。我這樣做,它只是打印索引和dtype。 – adurbin

相關問題