2017-07-07 173 views
1

我想用原始數據框(數據框1)中的行填充熊貓數據框(Dataframe 2)。我在下面創建了一個模擬Dataframe 1:創建一個每個值只有一行的新數據框

Ref Number Name 
1   Alpha 
2   Alpha 
3   Alpha 
4   Alpha 
5   Beta 
6   Beta 
7   Beta 
8   Charlie 

我想刪除其中前一行中發生值Name的行。即Dataframe 2應該看起來像

Ref Number Name 
1   Alpha 
5   Beta 
8   Charlie 

Ref Number在這種情況下無關緊要。在我的工作文件中,我正計劃添加一列來指定某些內容,然後在應用某個函數時引用該內容。

我會如何去熊貓這方面呢?我有一個約5000行的CSV,我想限制到~1000的第二個數據幀。

+0

你是什麼意思「REF號碼也無所謂」是什麼意思?它是多餘的嗎?在那種情況下,爲什麼還要使用表格格式呢?你只需要一組值(set)(df [「Name」])''。 – Denziloe

回答

1

使用drop_duplicates與指定列Name爲找到重複:

df = df.drop_duplicates('Name') 
print (df) 
    Ref Number  Name 
0   1 Alpha 
4   5  Beta 
7   8 Charlie 
+0

謝謝!加了! – christaylor

+9

我們應該可以找到一個體面的[重複](https://stackoverflow.com/search?q=df.drop_duplicates).. – DSM

相關問題