2017-01-29 68 views
0

我有CSV文件,它有3列。如何編寫一個csv文件的第2列第3列條件

這是我必須做的:

我想寫一個if狀況或任何類似if Divi == 'core'然後我需要的標籤(不同)沒有冗餘即計數(在標記中的兩個sand1核心司應被視爲只有一個計數)。

一個更若是喜歡Div === saturn or core && type == dev條件,那麼同樣的事情需要計數無標籤(不同)

誰能幫我這個?因爲這是我的想法..任何新的想法將被接受,如果它滿足要求 enter image description here

+2

你能證明你所嘗試過的嗎? –

回答

0

首先,用熊貓加載你的數據。

import pandas as pd 

dataframe = pd.read_csv(path_to_csv) 

第二,正確地格式化數據(您可能需要小寫/大寫數據作爲從你的例子列「司」)

列在dataframe.columns: 數據幀[柱] =據幀[專欄] .lower()

如果你想僅僅通過一列,你可以算頻率:

dataframe['Division'].value_counts() 

如果要通過兩列,算你可以:

dataframe.groupby(['Division','tag']).count() 

希望幫助
編輯: 雖然這不會給你只是在滿足2個條件的數量,這是你問什麼,它會給你更多的「完整」的答案,顯示所有兩列組合的計數

相關問題