1
我有以下數據框,列中有一些值:ID'重複。 我想組由datafarmepandas groupby on dataframe and assigning back to orignal df failed with transform
df = pd.DataFrame(
{'Score': [0.65, 0.57, 0.56, 0.689, 0.56, 0.85, 0.45, 0.15, 0.14, 0.4678],
'ID': ['AAA', 'BBB', 'SAS', 'SAP', 'TCS', 'BBB', 'CTC', 'CTC', 'CTC', 'CTC'],
'Sample': ['AE01', 'AE01', 'AE03', 'AE03', 'AE03', 'AE05', 'AE05', 'AE05', 'AE05', 'AE05'],
'Freq': [1, 14, 14, 15, 16, 17, 18, 19, 20, 21],
'Type': ['Non', 'IND', 'IND', 'IND', 'IND', 'IND', 'IND', 'IND', 'IND', 'IND']},
columns=['Sample','ID','Type','Score','Freq'])
當我嘗試向組通過選擇添加「再」列得到它通過以下使用transform
df['Re']=df.drop_duplicates(['Sample','ID']).groupby(['ID']).transform(size)
的單行分配給原始數據幀DF
我收到以下錯誤,
ValueError: Wrong number of items passed 4, placement implies 1
我知道我可以做合併獲得通過的結果分配給該組的原始數據幀,但我當做合併我得到特定的行重複多次在原來的DF,我不需要。任何更好的解決方案都會很棒。 謝謝
謝謝你的作品:) – user1017373
很高興能幫助你! – jezrael