我有一個數據集由一些文本列(有限的可能性)和一些csv格式的數字列組成。有什麼方法可以自動將文本列轉換爲數字(例如:A將爲0,B將爲1等等)以將數據集轉換爲np.array
?python - 將數據轉換爲numpy數組sklearn
這將稍後在scikit-learn
上使用,所以在所有處理結束時它需要爲np.array
。
編輯:添加數據集的一行:
ENABLED;ENABLED;10;MANUAL;ENABLED;ENABLED;1800000;OFF;0.175;5.0;0.13;OFF;NEITHER;ENABLED;-65;2417;"wifi01";65;-75;DISCONNECTED;NO;NO;2621454;432477;3759;2.2436838539123705E-6;
您能給我們從文件(或「文本列」)的例子(節選),所以我們可以更好地理解你在使用什麼? 'numpy'的'genfromtext'可能是一個很好的開始,或者可能是'pandas.read_csv' ... – mgilson
已被添加到說明中。每個文本列可能有3或4個可能的值。 – Minoru