2016-09-17 93 views
3

我有一個從Kaggle的San Fransico工資中提取的數據框:https://www.kaggle.com/kaggle/sf-salaries 我希望創建一組列值,例如「狀態」。從熊貓系列中創建一個集合

這是我嘗試過的,但它帶來了所有記錄而不是集合的列表(sf是我如何命名數據框)。

a=set(sf['Status']) 
print a 

根據這個網頁,這應該工作。 How to construct a set out of list items in python?

+0

爲什麼你tsay'a'是一個列表? – tacaswell

+0

也許我錯誤地使用了這個術語,我指的是它給了我所有來自列的值而不關心它是否是純粹的nans –

回答

15

如果您只需要獲取唯一值列表,則可以使用unique方法。 如果你想有Python的集合,然後做set(some_series)

In [1]: s = pd.Series([1, 2, 3, 1, 1, 4]) 

In [2]: s.unique() 
Out[2]: array([1, 2, 3, 4]) 

In [3]: set(s) 
Out[3]: {1, 2, 3, 4} 

但是,如果你有數據框,只需選擇一系列出來的(some_data_frame['<col_name>'])。