2016-12-09 28 views
0

從我在文檔和各種示例中看到的, 典型的使用Mallet中的數據的worfklow要求您使用通常通過將數據傳遞到「管道「,同時用某種迭代器對它們進行迭代。數據通常存儲在某個csv文件中。如何使用雙精度數組作爲Mallet中的特徵向量

我想從兩個雙打數組中獲取功能列表。 一個數組存儲實際要素,大小爲n x m(其中n是要素的數量,m是要素矢量的數量),另一個大小爲1 x m且包含二進制標籤。我應該如何將它們轉換爲特徵列表,以便我可以在分類器中使用它們。

+0

向我們展示一些代碼。至少是您擁有的數據和您想要實現的目標的一個例子。 –

+0

具有每個特徵向量的包含特徵和Double []的Double [] []我的目標是獲得我可以用於訓練/分類的InstanceList對象。沒有必要寫出我獲得這些價值的方式 - 這並不重要。你甚至可以想象在編譯時兩個數組填充了值。 – dkaras

回答

0

我最終編寫了一個類似於Mullet中名爲「ArrayDataAndTargetIterator」的自定義迭代器。我還必須使用如下定義的管道:

new SerialPipes(Arrays.asList(new Target2Label(), new Array2FeatureVector())); 
+0

自定義迭代器聽起來像是正確的路要走。 –

相關問題