1
我有這樣一個數據幀:創建基於對大熊貓一個標準的虛擬varuable
date sales company country
16/03/2012 3000 H&M US
13/04/2012 2300 H&M US
26/03/2012 1230 H&M FR
13/04/2012 1300 H&M FR
23/03/2012 2230 H&M IT
19/04/2012 1100 H&M IT
16/03/2012 3000 ABC US
13/04/2012 2300 ABC US
26/03/2012 100 ABC FR
13/04/2012 60 ABC FR
23/03/2012 435 ABC IT
19/04/2012 300 ABC IT
我要定義一個標準:一個公司被認爲是一個INTERNATINAL,如果低於50%的( avarage)來自單一國家的銷售額。我想創建一個新的列,如果它是國際的,則值爲1,否則爲0。最終輸出應該是這樣的:
date sales company country international
16/03/2012 3000 H&M US 1
13/04/2012 2300 H&M US 1
26/03/2012 1230 H&M FR 1
13/04/2012 1300 H&M FR 1
23/03/2012 2230 H&M IT 1
19/04/2012 1100 H&M IT 1
16/03/2012 3000 ABC US 0
13/04/2012 2300 ABC US 0
26/03/2012 100 ABC FR 0
13/04/2012 60 ABC FR 0
23/03/2012 435 ABC IT 0
19/04/2012 300 ABC IT 0
我該怎麼做? P.S:數據集中可能缺少銷售值,我怎麼能忽略這些值?
我有類似的東西,但沒有你們以前做這個的機會得到迴應。不過,我會將df2和df1更改爲s1和s2,因爲它們是系列而不是數據框+1 –
vaaw偉大的回答:) – edyvedy13