2016-08-30 133 views
0

我有1000個文件,其中數據存儲在逗號分隔中。 一個文件的描述在下面給出:從熊貓讀取csv文件並繪製

的值用逗號分隔,-9999值應被忽略, ,如果它可以被讀取,行和列中的所有值應該存儲在數字, 因爲它具有用於繪圖。 文件的形狀是[104行×15列]。

文件的幾行如下:

0, 9.8597e+00, 129.944, 1.071, 6.7433e-06, 1.0911e-05,  -9999,  -9999, 3.7134e-07, 3.5245e-05,  -9999,  -9999, 26.295, -86.822, -123.017 



0, 8.7012e+00, 130.908, 0.966, 1.9842e-06, 1.0799e-05,  -9999,  -9999, 3.5888e-07, 7.8133e-05,  -9999,  -9999, 27.140, -86.818, -122.322 

讀入數值後,我需要把它繪製成插曲也。 像COl1與Col2,Col3與col5等....

任何想法如何實現它?

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 

df1=pd.read_csv("small_file_106.txt",header=1) 
print(df1) 

回答

1

我從來沒有使用過的情節,但下面將是第一個問題 輸入有用值來na_values列表,這些將大熊貓被視爲NA

pd.read_csv(File, sep=',',na_values=['-9999'],keep_default_na=False) 

而且pd.to_numeric是提供給數據一旦你已經閱讀(四條的方法看起來很不錯)的Seaborn library's pairplot SH將數據轉換爲數字

df.apply(lambda x: pd.to_numeric(x, errors='ignore')) 
0

應該生成你想要的情節。

+0

謝謝現在大部分時間都適用! – MPJ