假設我有一個數據幀,如計數,Python的大熊貓:次每個唯一值出現多列
In [7]: source = pd.DataFrame([['amazon.com', 'correct', 'correct'], ['amazon.com', 'incorrect', 'correct'], ['walmart.com', 'incorrect', 'correct'], ['walmart.com', 'incorrect', 'incorrect']], columns=['domain', 'price', 'product'])
In [8]: source
Out[8]:
domain price product
0 amazon.com correct correct
1 amazon.com incorrect correct
2 walmart.com incorrect correct
3 walmart.com incorrect incorrect
我想算,每個domain
,次price == 'correct'
和price == 'incorrect'
數量,和product
一樣。換句話說,我想看到像這樣的輸出,
domain key value count
0 amazon.com price correct 1
1 amazon.com price incorrect 1
2 amazon.com product correct 2
3 walmart.com price incorrect 2
4 walmart.com product correct 1
5 walmart.com product incorrect 1
我該怎麼做?
這是一個清晰的解決方案。 'x'是一個'DataFrame',它包含所有具有相同域的行,並且將'x'中的'price'和'product'列轉換爲''''系列'對象,每列一個,然後計數每個不同值出現在'y'中的時間。 – duckworthd