2017-03-07 135 views
1

我是熊貓新手,我一直在嘗試做一個散點圖在Python 2.7中,我有.txt文件中的數據集像這樣(逗號分隔)如何使用熊貓閱讀Python中的文本文件

6.1101,17.592 
5.5277,9.1302 
8.5186,13.662 
7.0032,11.854 
5.8598,6.8233 
8.3829,11.886 
7.4764,4.3483 



import pandas as pd 
import matplotlib.pyplot as mplt 

# Taking Dataset using Pandas 

input_data = pd.read_csv('data.txt'); 
#input_data.head(5) 

如何在散點圖上繪製上面的數據而不在數據集上有任何標題?

我在教程和例子中看到,如果數據集有列標題,那麼可以繪製散點圖。我試着把x和y作爲數據集中兩列的標題放在.txt文件中,然後嘗試下面的代碼。

input_data = pd.read_csv('data.txt'); 
#input_data.head(5) 
x_value = input_data[['x']] 
y_value = input_data[['y']] 

mplt.scatter(x_value, y_value) 

但仍然如下圖所示

Traceback (most recent call last): 
    File "E:\IIT Madras\Research\Experiments\Machine Learning\Linear Regression\Linear_Regression.py", line 16, in <module> 
    y_value = input_data[['y']] 
    File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 1791, in __getitem__ 
    return self._getitem_array(key) 
    File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 1835, in _getitem_array 
    indexer = self.ix._convert_to_indexer(key, axis=1) 
    File "C:\Python27\lib\site-packages\pandas\core\indexing.py", line 1112, in _convert_to_indexer 
    raise KeyError('%s not in index' % objarr[mask]) 
KeyError: "['y'] not in index" 

我收到提示是否有更好的方法來解決這個問題(有和沒有標題名稱)?

編輯:

下通過依禪會後爲我工作的答覆

input_data = pd.read_csv('data.txt', header =None); 
x_value = input_data[[0]] 
y_value = input_data[[1]] 
mplt.scatter(x_value, y_value) 
mplt.show() 
+2

你可以要麼添加標題或名稱,要麼通過數字索引來引用列。 'read_csv'的參數是'names',參見http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html – pvg

回答

3

嘗試通過自己的導入數據,而不列標題,然後命名列:

df=pd.read_csv(r'/home/ishan/Desktop/file',header=None) 
df.columns=['x','y'] 
import matplotlib.pyplot as plt 
plt.scatter(df['x'],df['y']) 
plt.show() 
+0

工作,我用索引0和1代替x,y –