2016-03-04 246 views
1

我讀了一些教程和介紹,但我不知道我得到了它的竅門,最重要的是,我不知道我的理解ML VS NN完全。機器學習在Python:scikit學習/ Pybrain

假設我想指示程序(像scikit學習),使其作爲其輸入設置一些語言詞典。例如,我有一個大詞典的意大利話,我可以輸入作爲數組的數組(數組是單個字,並且每個字的每個產品的ASCII值的陣列,一個用於世界的每個字符):

[ 
    [112, 105, 122, 122, 97], // pizza 
    [109, 097, 109, 109, 97], // mamma 
    ... 
] 

難道不可能性/什麼是最好的圖書館/如何做到這一點:

  1. 給出一個單詞,讓程序推斷,如果它可能是一個意大利詞,讓「黑手黨」是公認作爲一個潛在的實際的意大利詞,但「Eichhörnchen」不是(它比意大利的普通世界更長,它包含了像「rnch」這樣的序列,它們在最初的集合中沒有找到,它包含了「ö」在意大利使用)
  2. 基於初始設置其他(可能)意大利語單詞。例如,「potomo」不是實際的意大利詞,但據意大利正字它可能

回答

0

我覺得樸素貝葉斯分類和KNN可以used.Naive貝葉斯分類被證明可以過濾垃圾郵件,但在此之前你需要一本詞庫。