2013-07-08 41 views
0

我目前使用來自UCI存儲庫的數字數據集來運行簡單的機器學習技術。問題是數據集被限制爲256維,因爲它是16 * 16像素的圖片。我想知道如果我有一個64 * 64像素的數字輸入,我是否需要將它縮小到16 * 16還是有一種我可以使用的技術?用於數字/字母識別尺寸限制的數據集

回答

0

我知道的每一位數字識別算法都會起作用,不管圖像的具體分辨率如何,但如果您真的擔心,我建議您將數據提前標準化至[0.0, 1.0)範圍。

這也適用於不是正方形的圖像。例如,在16x16的圖像中,16會根據您的偏好映射到1.0或15/16。這可以放大到任意大小的圖像。如果你想要一些示例代碼,我可以提供一些你選擇的語言。

+0

我的數據是一個256個數字的零和一個範圍。我真的不明白在哪裏規範化適合這裏O_o –

+0

通常數組不會採取真正的價值指數。因此,某些內插可能需要創建相同大小的圖像。 – alfa

+0

@TrtTrt我想說的是,如果你想讓兩個陣列相媲美,你就不必在完全不同的事情上對待它們。 Tbh我不確定在處理兩種不同大小的圖像文件時會遇到什麼問題。我通常會對所有處理過的圖像進行歸一化處理,然後在單元格之間進行線性插值(如果我需要的話),但是如果您能夠準確解釋您的問題,我可能會幫助更多。 –