0

所以基本上我處理的培訓和測試數據集(一堆陣列)不等長這樣的:如何使用受監督的機器學習方法處理不同的輸入尺寸?

a: {true, [1,3, 4, 5, 5, 8 ,10 ,10]} 
b: {true, [1,3, 25, 18 ,1 ,10]} 
c: {false, [1, 8 ,10]} 
d: {false, [1,3 ,10 ,10]} 

我是新來的機器學習方面,我在如何使這些未stucked -EQUal長度的輸入數組相等長度,從而可以利用現有的機器學習算法容易..

目前我能想到用最大的共同序列來找出與不同長度的輸入數組之間的相似..

但基本上在我得到LCS信息後,如何轉換orm輸入數組到相等長度的..?

我是否正確?任何人都可以給我一些幫助嗎?

回答

1

這樣的任務沒有通用的解決方案。一切都取決於你的數據實際上是什麼代表。有幾十種特徵提取技術可以很好地處理各種長度的數據,但是特定的特徵選擇取決於特定的任務。沒有也不可能有一種將變長表示法變爲恆定長度表示法的通用方法。 LCS似乎是非常奇怪的方法,應該給出非常錯誤的結果(至少在一般情況下,可能在這個特定的問題中它有意義)。如果是這種情況(LCS的確有意義),它將返回一維的新表示。它只是一個功能你的新載體。您需要更多才能應用任何合理的機器學習技術。

+0

謝謝,最終我只是在每個輸入數組中追加了一個0的序列...... – computereasy

0

大多數ML算法需要固定的輸入和輸出。全卷積神經網絡或遞歸神經網絡可以處理不同的輸入和輸出。

但在你的情況,我會建議只是最大。數組長度並將零追加到具有較少項然後最大值的數組中。