3
我試圖找到一種有效的方法來確定DataFrame中具有最高值的行一個列(值),當他們的「字符串」在另一列(字符串)是相同的,創建一個新的列(主題)與此信息供以後使用。Python:在DataFrame中,將值添加到另一列中具有最高值的行的新列中,並在第三列中將值相同的字符串
這裏一個數據幀的例子:
String N value
0 EXAM 10 250
1 EXAMP 20 350
2 EXAMPLE 30 450
3 EXAMPLE 40 400
4 EXA 50 300
5 EX 60 100
以下是我在尋找:
String N value motif
0 EXAM 10 250 Nan
1 EXAMP 20 350 Nan
2 EXAMPLE 30 450 1
3 EXAMPLE 40 400 Nan
4 EXA 50 300 Nan
5 EX 60 100 Nan
我試着用拆分到工作中採用的方法相結合
def group_motif(df):
if df.groupby(['String']).size() > 1:
"something like for row with the highest value in column ['value']":
"create a new column in df called ['motif'] and add value = 1 in the row
然後我想着做這個功能的groupby.apply
,然後結合不同的組,但我c不正確。
除了使用groupby
之外,有沒有一種有效的方法來實現?
由於它的作品! –