忽略io.StringIO
位這僅僅是一個傳遞一個字符串作爲文件緩存的方式,你可以加載此輕鬆調用read_csv
,並通過PARAMS header=None
和sep='\s+'
:
In [3]:
import io
import pandas as pd
temp = '''0.9731 0.9695 0.9857 0.9909 0.9448 0.9367 0.9976 0.9672
0.9723 0.9767 0.9767 0.9656 0.9625 0.9589 0.9429 0.9319
0.9858 0.9886 0.9883 0.9784 0.9729 0.9683 0.9567 0.9428
0.9834 0.9838 0.9886 0.9782 0.9729 0.9629 0.9849 0.9456'''
df = pd.read_csv(io.StringIO(temp), header=None, sep='\s+')
df
Out[3]:
0 1 2 3 4 5 6 7
0 0.9731 0.9695 0.9857 0.9909 0.9448 0.9367 0.9976 0.9672
1 0.9723 0.9767 0.9767 0.9656 0.9625 0.9589 0.9429 0.9319
2 0.9858 0.9886 0.9883 0.9784 0.9729 0.9683 0.9567 0.9428
3 0.9834 0.9838 0.9886 0.9782 0.9729 0.9629 0.9849 0.9456
我不知道這些是什麼值是但你可以直接指定列:df.columns = [some_col_list]
或通過一個列表read_csv
,names=some_col_list
要傳遞特定的列sklearn只是索引他們例如如果您的列名稱爲col1....coln
,那麼您可以撥打clf.fit(df['col1'], df['coln'])
,假設col1和coln分別是您的X和y列。
據我所知,與大熊貓對象scikit學習,所以用大熊貓。 – Phlya 2015-02-23 13:28:09