我的數據框有一個可包含長字符串的字符串列。我想獲取唯一字符串的列表,以及每個包含行索引的唯一字符串的列表。熊貓 - 從列中獲取唯一值以及它們出現的行索引列表
我可以想到兩種方法。
- 首先使用
.unique()
獲得獨特的列表,然後遍歷數據框建立索引列表,其中每個獨特的價值顯示出來 - 使用
.groupBy()
每組 在創建組,並得到行索引名單
但我不太確定哪一個更有效率(或者如果有其他方法可以更有效地做到這一點)。我在考慮效率的原因是,我想分離和分組的字段是一個字符串字段,可能有很長的字符串!
謝謝!
太棒了!所以按一個可以有長字符串值的列進行分組並不是一個壞主意,對吧? – shikhanshu
@shikhanshu,是的,我相信這是正確的做法... – MaxU