1
我一直在研究抓取網頁和提取網站的元素。 例如: 給定一個網站 - 履帶應返回以下幾個部分:頭,菜單,頁腳,內容等機器學習瞭解Python中的網站結構
我在想,這將是巨大的,如果我可以使用機器學習來訓練代碼,以瞭解如何分類網站。
我試着看着Python機器學習庫(例如:PyBrain),但這些例子非常複雜。 任何人都可以請建議我一個庫和一些教程如何開始使用Python機器學習與一些簡單的例子?
謝謝!
我一直在研究抓取網頁和提取網站的元素。 例如: 給定一個網站 - 履帶應返回以下幾個部分:頭,菜單,頁腳,內容等機器學習瞭解Python中的網站結構
我在想,這將是巨大的,如果我可以使用機器學習來訓練代碼,以瞭解如何分類網站。
我試着看着Python機器學習庫(例如:PyBrain),但這些例子非常複雜。 任何人都可以請建議我一個庫和一些教程如何開始使用Python機器學習與一些簡單的例子?
謝謝!
MLPy對您而言可能更簡單。 這裏是documentation on classification的鏈接。順便說一句,如果你不知道類應該是什麼樣子,也許你需要cluster你的頁面,而不是分類它們。