1

我是機器學習領域的新手。我參加了Udacity的「機器學習入門」課程。所以我知道使用sklearn和python來運行基本的分類器。但是他們在課程中教授的所有分類都是使用單一數據類型進行培訓的。如何一起訓練不同要素類型的分類器?像字符串,數字,分類,時間戳等

我有一個問題,其中我想分類代碼提交爲「乾淨」或「馬車」。 我有一個包含字符串數據(如人名)設備的功能集,分類數據(說「乾淨」與「車」),數字數據(如無,提交的)和時間戳數據(如提交的時間)。如何根據這三個特徵同時訓練分類器。假設我計劃使用Naive Bayes分類器和sklearn。請幫忙!

我想實現的paper。任何幫助真的是可觀的。

回答

0

很多機器學習分類像logistic迴歸,隨機森林,決策樹和SVM很好地工作連續和分類功能。我的猜測是你有兩條路要走。第一個是數據預處理。例如,將所有字符串/類別數據(人物名稱)轉換爲整數,或者您可以使用集合學習

集成學習是當你把不同的分類器(每一個都帶有一種異質特徵的交易)採用多數表決,例如,這樣他們就可以找到分類的共識。希望能幫助到你。

+0

嗨維克多。我一直在研究這個問題,但找不到任何實質性的東西。我正在使用scikit-learn庫。你能幫我解決一些關於如何在分類器中使用不同類型的特徵的例子嗎?提前致謝 – harshlal028