我正在爲外匯市場設計一個自動交易軟件。 在MYSQL數據庫中,我每隔五分鐘就有多年的市場數據。對於這些數據,我有5個不同的度量標準以及價格和時間。如何執行「N-nearest neighbors?」的多維搜索?
[Time|Price|M1|M2|M3|M4|M5]
x ~400,0000
Time
是主密鑰,並通過M1
是M5
不同的指標(如標準偏差或移動平均的斜率)。
給定輸入M1
,M2
,M3
,M4
和M5我怎樣纔能有效地定位最近的5000個鄰居?請注意,每個度量標準都是浮點數,並具有不同的分佈/範圍。
我增加了一個答案,但我不得不猜測什麼會決定「最近的鄰居」。你可以定義什麼樣子? – Narnian