2009-10-01 25 views
0

考慮設置每天銷售目標的銷售部門。總目標並不重要,但超齡或未成年人是。例如,如果第1周的週一有50的目標,我們賣60,那麼得到+10的分數。週二,我們的目標是48,我們以46分的成績-2。在週末,我們得分的一週是這樣的:查找多維數組中的相似性

[0,0]=10,[0,1]=-2,[0,2]=1,[0,3]=7,[0,4]=6 

在這個例子中,週一(0,0),週四和週五(0,3和0,4)是「熱」

如果我們看一下從第2周的結果,我們可以看到:

[1,0]=-4,[1,1]=2,[1,2]=-1,[1,3]=4,[1,4]=5 

第2周的週末是熱的,和週二是溫暖的。

接下來,如果我們比較第一週和第二週,我們可以看到本週結束時比一週的前半部分更好。所以,現在我們來添加第3周和第4周:

[0,0]=10,[0,1]=-2,[0,2]=1,[0,3]=7,[0,4]=6 
[1,0]=-4,[1,1]=2,[1,2]=-1,[1,3]=4,[1,4]=5 
[2,0]=-8,[2,1]=-2,[2,2]=-1,[2,3]=2,[2,4]=3 
[3,0]=2,[3,1]=3,[3,2]=4,[3,3]=7,[3,4]=9 

從這裏我們可以看到,一週結束時理論是成立的。但我們也看到,月底比起跑要好。當然,我們希望下個月與下個月進行比較,或者比較一組季度或全年的結果。

我不是一個數學或統計學傢伙,但我很確定有這種類型的問題設計的算法。由於我沒有數學背景(並且不記得我早期的代數),我會在哪裏尋求幫助?這種「熱點」邏輯是否有名字?有公式或算法可以切片和比較多維數組嗎?

任何幫助,指針或建議表示讚賞!

回答

2

這個數據不是真的多維的,它只是一個簡單的時間序列,並且有很多很多方法來分析它。我建議你從Fourier Transform開始,它會在一系列中檢測出「節奏」,因此這些數據會在7天和30天左右出現尖峯,如果將數據集擴展到幾年,它會顯示爲季節和假期提供一年的高峯期。這應該讓你忙一段時間,直到你準備好使用真正的多維數據,比如增加天氣信息,股票市場數據,最近的體育賽事結果等等。

+0

哎喲,快幾秒鐘。 – fortran 2009-10-01 18:32:32

+5

我把整個事情都熱切了。我知道總有一天有人會問一個答案是「傅里葉變換」的問題。這釋放了[f10],只剩下兩個。 – Beta 2009-10-01 20:25:49

+0

xDDD我會爲你評論兩次,如果我能:p – fortran 2009-10-01 21:29:46

1

你想要做的事很簡單 - 你只需要計算你的數據的autocorrelation並看看correlogram。從相關圖中,您可以看到數據的「隱藏」時段,然後您可以使用此信息分析時段。

這是結果 - 你的數字和它們的歸一化自相關。

 
10 1,000 
-2 0,097 
1 -0,121 
7 0,084 
6 0,098 
-4 0,154 
2 -0,082 
-1 -0,550 
4 -0,341 
5 -0,027 
-8 -0,165 
-2 -0,212 
-1 -0,555 
2 -0,426 
3 -0,279 
2 0,195 
3 0,000 
4 -0,795 
7 -1,000 
9 

我使用Excel來獲取值。但列A中的序列並將等式=CORREL($A$1:$A$20;$A1:$A20)添加到單元格B1,然後複製它,然後複製到B19。如果你添加一個線圖,你可以很好地看到數據的結構。

1

在我看來,一個OLAP方法(如MS Excel中的數據透視表)完全適合這個問題。

+2

我認爲這對於那些不試圖在R或其他方面破解這些數據並獲得複雜的預測或統計顯着性結果的人來說是最有用的建議。 Excel中的數據透視表非常有用,不難設置或使用,而且您幾乎可以肯定已經擁有適當的工具。 – Harlan 2009-10-02 19:52:47

0

您可以對模式的時間段進行合理的猜測 - 您正在查看諸如每週和每月的事情。例如,要查看每週模式,只需將所有星期一起平均,等等。一個月中的幾天,一年中的幾個月也是如此。

當然,你可以使用一個複雜的算法來找出每週模式,但你已經知道要這樣做。如果您認爲真的可能存在您永遠不會懷疑的模式(有一個奇怪的社區人羣每週使用5天的時間並頻繁開展業務),那麼您可以使用強大的工具 - 但如果您知道要尋找什麼樣的東西,真的沒有必要。

2

以下內容可能與您有關:技術分析中的Stochastic oscillators,用於確定股票是否超買或超賣。

我簡單化這裏,但本質上你有兩個移動計算:

  • 14天隨機:100 *(今日收盤價 - 低的最後14天)/(高的前14天 - 最近14天的最低價)
  • 3天隨機:相同的計算,但相對於3天。

14天和3天的隨機指標將趨向於遵循相同的曲線。您的隨機指標將在1.0和0.0之間;高於0.8的隨機指標被認爲超買或看跌,低於0.2則表明超賣或看漲。更具體地說,當你的3天隨機「穿越」其中一個區域的14天隨機指標時,你可以預測價格的動量。

儘管有些人認爲技術分析是巫術,但empirical evidence表明它有一定的預測能力。就其價值而言,隨機指標是一種非常簡單而有效的方法,可以隨時間變化顯示價格的勢頭。

0

丹尼爾有正確的想法,當他建議相關但我不認爲自相關是你想要的。相反,我會建議將每週與每週的關聯。相關性中的峯值 - 即接近1的值 - 表明這些特定轉變的星期值彼此相似(即,是peiodic)。

例如,當你穿過關聯

0 0 1 2 0 0 

​​

結果將是

2 0 0 1 3 0 

的最高值是3,其對應於移位(右)的第二個數組排列4

0 0 0 1 1 0 --> 0 0 1 1 0 0 

和thenn乘以組件明智

0 0 1 2 0 0 
0 0 1 1 0 0 
---------------------- 
0 + 0 + 1 + 2 + 0 + 0 = 3 

注意,當你相關,你可以創建自己的「假」周和所有你真正星期,這個想法是,你正在尋找「形交叉關聯「通過查找相關結果中的峯值,可以查看與假周形狀相對應的每週值。

所以,如果你有興趣在尋找周是接近近一週結束時,您可以使用「假」周

-1 -1 -1 -1 1 1 

,如果你在相關的第一個值高響應這意味着您關聯的真實周具有大致這種形狀。

0

這可能超出了您要查找的範圍,但是一種技術方法可以讓您進行預測,查看諸如統計顯着性等等的功能,可能是ARIMA或類似的Box-Jenkins楷模。