預處理匿名數據以進行預測分析的步驟是什麼？

假設我們有一個大型的匿名數據數據集。數據集包含一定數量的變量和觀察值。我們可以瞭解的所有數據都是變量的類型（數字，字符，日期等）。我們可以通過手動查看數據來完成。用於進一步分析的預處理數據集的最佳實踐步驟是什麼？預處理匿名數據以進行預測分析的步驟是什麼？

就比如，讓這組數據只是一個表，所以我們並不需要檢查表之間的任何關係。

2015-09-21 angubenko

This link給出了一套完整的驗證目前在實踐中。不過，先從：

希望這是不夠好，讓你開始...

2015-09-21 20:41:29 displayName

可能我需要更新的問題，以澄清。請參閱更新。 – angubenko

@angubenko：我看不到你的問題有任何更新。 – displayName

對不起，我輸入了它 – angubenko

回答