2017-02-14 63 views
-7

我有幾行以.csv格式顯示的數據行。預測即將到來的月份的患者數

speciality,year,month,count 
"general",2016,1,100 
"general",2015,1,110 
"general",2014,1,105 
"cardiolody",2016,1,60 
"cardiology",2015,1,58 
..... 
..... 

此處第1行表示100名患者在一般藥物類別中由醫生治療。第4行相似表示60名患者在2016年1月接受了心臟病專家的治療,等等。我想要預測在即將到來的月份中每個專業類別的患者人數,例如2017年1月。 輸出應在一個單獨的csv文件和形式

speciality,month,prediction_of_patients 

的請建議,使用R語言,Python或Spark.Thanks機器學習溶液(迴歸優選)至我的問題。

+1

歡迎SO!你的問題是a)太廣泛b)與編程perse無關。出於這個原因,我建議關閉這個問題。如果您有更具體的,與編程相關的問題,請隨時發佈一個新問題。 –

+0

這應該是封閉的,因爲它是基於非常意見的,關於堆棧溢出的問題應該顯示對解決方案的先前研究 – WhatsThePoint

+0

您應該在[Stack Exchange](http://stats.stackexchange.com)詢問,因爲這更多地關於模型,而不是編程。 – LAP

回答

0

你似乎沒有什麼預測指標。因此,我會建議使用靈活的方法,如提升。

但我相信你不會有準確的結果給出預測的數量...