我有CSV三列的數據集,如何羣集(或分組)來自CSV文件的數據?
A,B,10
A,C,15
A,D,21
B,A,10
B,C,20
欲組或簇A,基於所述第三列B,C,d對。條件是增加10. 0-10一個簇,11-20另一個簇等等。每個羣集將包含A,B,C,D對。基本上,如果第三列在0-10之間,一對將進入第一個簇。 A,B在第三列中有10個,所以他們進入第一個集羣。我期望它是10-15個集羣。
這是我如何打開CSV:
fileread = open('/data/dataset.csv', 'rU')
readcsv = csv.reader(fileread, delimiter=',')
L = list(readcsv)
我創建了一個集:
set(item[2] for item in L if (item[0]=='A' and item[1] == 'B' and item[2] <= 10)
我在這裏的基本問題是如何檢查的第三列和對存儲在一個集羣?
你嘗試過這麼遠嗎?最後例子中的語法提示了一個字典 - 你試過了嗎?你可以生成'輸出產生的三列比較'(原文如此)嗎?你的問題到底是什麼? – jonrsharpe
@jonrsharpe我已經更新了這個問題。 –
@jonrsharpe只是一個想法:而不是快速判斷和降級人們的問題,只是想一下,然後行動......就像tobias_k做的那樣......那麼這將是一個更好的社區 –