0

我想基於推文和移動平均數的歷史計數來預測用戶將發出的推文數量。我是一名Python開發人員,但在ML中總是noob。以下是在數據組I具有例如從用戶@POTUS:Python:預測來自用戶的推文數量

Date | Number of tweets 

01-03-2017 : 3 
02-03-2017 : 2 
03-03-2017 : 7 
06-03-2017 : 2 
07-03-2017 : 6 
08-03-2017 : 6 
09-03-2017 : 5 
10-03-2017 : 5 
11-03-2017 : 6 
13-03-2017 : 11 
14-03-2017 : 5 
15-03-2017 : 10 
16-03-2017 : 6 
17-03-2017 : 7 
18-03-2017 : 3 
19-03-2017 : 2 
20-03-2017 : 6 
21-03-2017 : 9 
22-03-2017 : 1 
23-03-2017 : 3 
24-03-2017 : 4 

我還計算使用https://github.com/linsomniac/python-movingaverage/blob/master/movingaverage.py

Moving Average, 3 days : 
[4.0, 3.67, 5.0, 4.67, 5.67, 5.33, 5.33, 7.33, 7.33, 8.67, 7.0, 7.67, 5.33, 4.0, 3.67, 5.67, 5.33, 4.33, 2.67, 4.0, 3.67, 4.33, 4.33, 6.0, 6.67, 5.67, 3.67, 2.33] 

Moving Average, 7 days : 
[4.43, 4.71, 5.29, 5.86, 6.29, 6.86, 6.86, 7.14, 6.86, 6.29, 5.57, 6.14, 4.86, 4.43, 4.0, 4.29, 4.29, 4.29, 3.71, 4.57, 5.29, 5.0, 4.43, 4.71] 

我明白這是一個迴歸問題而不是7天和3天的移動平均相當確定如何進一步採取這一做法。我的方法是預測用戶在接下來的幾天內會發出多少推文?

+3

這是題外話題,對於SO來說太寬泛了。嘗試研究機器學習算法,找出方法進行預測。 – Craig

+0

和其他功能比以前的鳴叫計數...(否則你只能自動迴歸) –

回答

0

您發佈的數據被格式化爲:

[日期格式] [數字格式]

要執行的數值迴歸,格式化爲日期的信息必須被格式化爲一個數字。這通常通過將信息轉換成自特定日期以來的天數來完成。如果格式化數據爲:自2017年1月3日天] [數字鳴叫]

這將是更適合的數值分析。我建議,在重新格式化數據之後,您會繪製散點圖,並查看是否存在某種可能以數學方式建模的可見趨勢。如果你看不到這種簡單的數據趨勢,那麼機器學習也可能找不到。