2016-04-08 35 views
0

我需要在我的數據集中創建一個新變量,該變量考慮了在線評論的過帳順序。創建產品ID的變量'訂單'會計

該數據集包含來自亞馬遜的特定產品的在線評論(由其ASIN號標識)以及相應的Unix時間戳。到目前爲止,我已經能夠通過ASIN對產品進行分類,並在此範圍內通過時間戳。現在我想用這樣的發佈順序創建列:

I need the posting order to start from 1 every time that ASIN changes

如何做到這一點在Excel或R任何想法?

非常感謝!

回答

0

R,我們可以使用avebase R,以創建由組( 「ASIN」)的序列。

df1$PostingOrder <- with(df1, ave(seq_along(ASIN), ASIN, FUN= seq_along)) 

較短,緊湊的辦法是

library(splitstackshape) 
getanID(df1, "ASIN")[] 
+1

真棒!謝謝!! – JorgeF

0

在Excel中,隨着工作表的佈局,在E列中使用以下公式(並填充)。

=IF(B2<>B1,1,E1+1) 
+0

謝謝OldUgly!我修改了一點你的公式,因爲第一行(E2)必須默認爲1,然後'= IF(B3 <> B2,1,E2 + 1)'放在E3中(並填充下來)。這完美解決。非常感謝!! – JorgeF