2016-06-08 45 views
-2

我正在運行我的整個活動目錄對用戶帳戶試圖找到不屬於。 使用我的代碼我的輸出給了我只在用戶名列中出現一次的單詞。儘管我正在分析一列數據,但我想保留數據的所有列。Python:使用熊貓,我如何選擇輸出中的列?

from pandas import DataFrame, read_csv 
import pandas as pd 
f1 = pd.read_csv('lastlogonuser.txt', sep='\t', encoding='latin1') 
f2 = pd.read_csv('UserAccounts.csv', sep=',', encoding ='latin1') 
f2 = f2.rename(columns={'Shortname':'User Name'}) 
f = pd.concat([f1, f2]) 
counts = f['User Name'].value_counts() 
f = counts[counts == 1] 
f 

我得到這樣的事情,當我運行我的代碼:

sample534   1 
sample987   1 
sample342   1 
sample321   1 
sample123   1 

我想一切從txt文件中的數據在我出去放出來,但我還是隻是想分析用戶名列。如何將所有數據保留在所有列中,還是必須使用不同的字數才能包含所有數據列?

我想是這樣的:數據

User Name Description 
1 sample534 Journal Mailbox managed by   
1 sample987 Journal Mailbox managed by  
1 sample342 Journal Mailbox managed by 
1 sample321 Journal Mailbox managed by 
1 sample123 Journal Mailbox managed by 

樣品我使用:根據您的描述

Account User Name User CN      Description 
ENABLED MBJ29  CN=MBJ29,CN=Users    Journal Mailbox managed by 
ENABLED MBJ14  CN=MBJ14,CN=Users    Journal Mailbox managed by 
ENABLED MBJ08  CN=MBJ30,CN=Users    Journal Mailbox managed by 
ENABLED MBJ07  CN=MBJ07,CN=Users    Journal Mailbox managed by 
+2

請顯示你的數據文件的樣本。 – BrenBarn

+2

請不要*描述*您的數據。在你的文章中包含* actual *數據的*樣本*。 – BrenBarn

+1

[如何製作好重現熊貓的例子](http://stackoverflow.com/questions/20109391/how-to-make-good-reproducible-pandas-examples) – MaxU

回答

1

,我猜你想使用的獨特元素的計數爲指標來選擇數據框中的行。也許你可以試試這個:

df2 = pd.DataFrame()  
counts = f['User Name'].value_counts() 
counts = counts[counts == 1].index 
for index in counts: 
    df2 = df2.append(f[f['User Name'] == index]) 
+0

解決了正確選擇唯一元素索引的答案。 –