我有一個超過10萬行的dF和幾列寬 - 沒有什麼瘋狂的。我試圖根據大約4000個字符串的列表對行進行子集劃分,但我正在努力弄清楚如何這樣做。有沒有一種方法來使用類似的子集。如何基於字符串值列表對熊貓數據框進行分類?
東風看起來像這樣
dog_name count
===================
Jenny 2
Fido 4
Joey 7
Yeller 2
和字符串列表中包含的變量dog_name_list=['Fido', 'Yeller']
我試着沿 df[df['dog_name'].isin(dog_name_list)
線的東西,但我得到一個有趣的錯誤: unhashable type: 'list'
我檢查了similar question,docs和this的子集數據通過查看列表中是否存在某個值,但是這讓我無所適從,而且我對我所缺少的東西有些困惑。非常感謝別人的建議!
檢查'dog_name'列中是否有任何列表:'any((在df.dog_name中v的isinstance(v,list)))' – Alexander
您的命令是正確的,可能是Alexander指出的一個數據問題。 –