我已經在Python上工作了大約2個月,所以我對它有了一個很好的理解。從CSV文件創建矩陣
我的目標是使用CSV數據創建矩陣,然後從該CSV文件的第3列中的數據填充該矩陣。
我想出了這個代碼迄今:
import csv
import csv
def readcsv(csvfile_name):
with open(csvfile_name) as csvfile:
file=csv.reader(csvfile, delimiter=",")
#remove rubbish data in first few rows
skiprows = int(input('Number of rows to skip? '))
for i in range(skiprows):
_ = next(file)
#change strings into integers/floats
for z in file:
z[:2]=map(int, z[:2])
z[2:]=map(float, z[2:])
print(z[:2])
return
與上面的代碼刪除垃圾數據後,在CSV文件中的數據是這樣的:
Input:
1 1 51 9 3
1 2 39 4 4
1 3 40 3 9
1 4 60 2 .
1 5 80 2 .
2 1 40 6 .
2 2 28 4 .
2 3 40 2 .
2 4 39 3 .
3 1 10 . .
3 2 20 . .
3 3 30 . .
3 4 40 . .
. . . . .
輸出應看起來像這樣:
1 2 3 4 . .
1 51 39 40 60
2 40 28 40 39
3 10 20 30 40
.
.
這個CSV文件中有大約幾千行和幾列,但是我只感興趣的是CSV文件的前3列。所以第一列和第二列基本上就像矩陣的座標,然後用第三列的數據填充矩陣。
經過大量的試驗和錯誤,我意識到numpy是矩陣去的方式。這是我試過到目前爲止帶有示例數據:
left_column = [1, 2, 1, 2, 1, 2, 1, 2]
middle_column = [1, 1, 3, 3, 2, 2, 4, 4]
right_column = [1., 5., 3., 7., 2., 6., 4., 8.]
import numpy as np
m = np.zeros((max(left_column), max(middle_column)), dtype=np.float)
for x, y, z in zip(left_column, middle_column, right_column):
x -= 1 # Because the indicies are 1-based
y -= 1 # Need to be 0-based
m[x, y] = z
print(m)
#: array([[ 1., 2., 3., 4.],
#: [ 5., 6., 7., 8.]])
然而,這是不現實的,我來指定我的劇本我所有的數據來生成矩陣。我嘗試使用生成器從我的CSV文件中提取數據,但對我來說效果不佳。
我儘可能多地學會了numpy,但它看起來好像它需要我的數據已經是矩陣形式,事實並非如此。
我不明白最後兩列的意思。前三個是清楚的...(行,列,值) – Nikaidoh