2017-02-02 81 views
0

我目前正在研究具有3維連續變量(x,y,z)的機器學習分類問題,我也想添加已經是離散變量的時間(t)。我的數據看起來像這樣一個例子:連續3維變量的離散化

 x     y     z     t 
[0.1 ,2.6, 0.0] [0.1 ,2.0, -3.0] [0.0 ,5.6, 5.0]   1486033702474 

將採取每個連續變量的意思足夠? 請問我該如何表示/格式化這些變量以在Python中的任何ML庫中形成我的訓練數據集?

+0

你能說清楚數據類型嗎?第一個向量x是時間還是每個元素對應於x,y,z?展開你的數據... – mik

+0

@mik所有元素(x,y,z)將根據時間範圍生成相同大小的向量say t2 - t1 – binkabir

回答

1

計算中的變量總是離散的。術語「連續」根本不適用,因爲計算機是數字機器,因此只能以有限的速率採樣數據。如果你想減少你的數據的粒度,取決於你的情況,取平均值是一個有效的選擇。在Python中採取數據列表的意思:

mean_x = sum(x) * 1./len(x) 
+0

感謝Woody1193,我會試試看看是否有意義的東西來出。 – binkabir

+0

如果它不能按預期工作,請回頭考慮變量表示的內容。試着弄清楚如何找出它們意義的核心。它是模糊的,但是在這個領域中按摩數學是需要一定的彎曲的 – Woody1193