0
我努力學習Python,但我試圖導入一個數據集,並不能得到它正常工作......問題導入數據集(txt文件)與Python使用numpy的庫genfromtxt功能
此數據集包含16列另有16 320行保存爲txt文件。我用了genfromtxt功能如下:
import numpy as np
dt=np.dtype([('name', np.str_, 16),('platform', np.str_, 16),('year', np.float_, (2,)),('genre', np.str_, 16),('publisher', np.str_, 16),('na_sales', np.float_, (2,)), ('eu_sales', np.float64, (2,)), ('jp_sales', np.float64, (2,)), ('other_sales', np.float64, (2,)), ('global_sales', np.float64, (2,)), ('critic_scores', np.float64, (2,)),('critic_count', np.float64, (2,)),('user_scores', np.float64, (2,)),('user_count', np.float64, (2,)),('developer', np.str_, 16),('rating', np.str_, 16)])
data=np.genfromtxt('D:\\data3.txt',delimiter=',',names=True,dtype=dt)
我得到這個錯誤:
ValueError: size of tuple must match number of fields.
但我dt變量,包含16種每列。 我指定數據類型,因爲否則這些字符串會被nan替換。
任何幫助,將不勝感激。
建議:從您的data3.txt文件中發佈一些第一行。你確定它有16列嗎? – payne
爲什麼所有的'(2,)'在dtype中?你定義了16個字段,但所有的浮點數都加倍了。你有沒有試過'dtype = None'加載?這讓它推斷出最好的dtype。 – hpaulj