我有一個看起來像這樣的表...如何創建一個採用列值取決於值是否構成大部分計數值的標誌?
id city date
1 chicago 5/1
1 chicago 5/2
1 new york 5/1
2 new york 5/3
2 seattle .
3 chicago .
4 seattle .
4 seattle .
我想創建一個第三列是採取「城市」,其中特定城市構成了大部分(> 51%)的值單個ID具有的條目數量。因此,例如,id#1將擁有favorite_city ='chicago'。我不知道哪裏可以開始...
幫助非常感謝。謝謝!
附註 - 我有SE我已經寫出了用於處理沒有多數或不足以創建多數的ID的邏輯。 – Patricia
因此,新列將具有前3行的'chicago'的值,那是你想要的嗎? – 54l3d
正確。在我的其他代碼中,我將選擇不同的ID並添加該變量作爲'case when'語句的一部分。 – Patricia