2014-10-02 74 views
1

我有訓練數據(.arff),我想轉換爲測試數據。如何將訓練數據轉換爲weka分類器的測試數據?

這是我的訓練數據:

@relation fix_labeled_tweet 

@attribute Text string 
@attribute class-att {relevant,not_relevant,additional} 

@data 
'pvj dengan ciwalk masih tetap jadi tempat fav untuk belanja;',additional 
'deta di bandung trade centre btc fashion mall;',additional 
'promo hotel bandung ibis trans studio enjoy our special price akan your wonderful weekend periode s di 27 desember;',not_relevant 
'indri theressa di cihampelas walk ciwalk;',additional 
'beiga we di jatinangor town square jatos;',additional 
'nonton di paris van java my husband;',relevant 
'mainya seringnya ke paris van java mall miko mall mana;',not_relevant 
'double date yeahhhh di braga city walk;',relevant 
'sinta di jatinangor town square jatos;',additional 
'terimakasih tas dompet teguh di cihampelas walk ciwalk;',additional 
'malam minggu miko the movie di cinema 21 mall panakukang;',additional 
'karaokean sekalian dugem patriot handrian di inul vista paskal hypersquare;',relevant 
'makan di mujigae korean resto ciwalk;',relevant 
'just posted a photo bandung trade center;',additional 

什麼,我已經試過是消除從數據標籤(另外,相關的,not_relevant),然後我保存爲不同的名字,但它不工作。 Weka說火車和測試儀不兼容。

回答

1

它們不兼容,因爲訓練集和測試集的結構不同。

如果你做了一份文件(比如說作爲Testing.arff),然後提供它作爲測試集,那麼分類器會接受文件。但是,如果您從測試文件中刪除使用過的屬性,則文檔不能使用,因爲某些輸入(用於分類)或輸出(用於評估)缺失。

我已經能夠在刪除類輸出時複製您的問題,但在複製文檔時,測試集按預期正常工作。

希望這會有所幫助!

+1

如果他擔心測試文件中的class屬性可用,我建議用?替換數據中的實際標籤。這表明.arff中缺少值,並且這些文件具有相同的結構。 http://www.cs.waikato.ac.nz/ml/weka/arff.html – Walter 2014-10-03 11:54:28

+0

感謝Walter,這是一個很好的觀點。 – 2014-10-03 14:02:00

相關問題