2012-09-27 43 views
1

我想開始玩弄AI工具在Python。我已經看過一些項目,但是我發現他們的例子令我畏懼有限的經驗等等。例如,我想構建一種方法來比較兩個html表,並構建一些讓我確定表是否描述相同概念的方法。現在我用暴力方法來做這件事,例如我有一個特定類型的已知表格。我找到並提取所有行標籤並創建一組唯一的行標籤。然後我拿一張新表,並將新表中的行標籤與集合中的行標籤進行比較,如果行標籤的交集足夠大,我將其聲明爲該特定類型的表。入門AI工具在Python

我讀書雖然建議我應該可以做一些較小的機械和更巧妙的,但我與如何開始掙扎。

任何人都可以點我有當使用AI工具來解決具體問題的實例訪問資源的方向。例如,假設我在文檔中遇到一個表,我想查看該表是否是我已經識別的幾種表中的一種。我如何通過示範表格,然後通過候選人表格進行檢查。我如何指定應該考慮的表格的屬性?

當我看文檔和示例,AI的資源,我發現他們是如此普遍,我對於失去知道如何甚至開始。

我添加上述讀取常見問題,我認爲這是一個公平的問題之後。我不想讓某人編寫pyBrain來讀取我的示例表,我想查找其他人使用過的或類似的東西,以便我可以研究他們的代碼。

謝謝

我在關閉後編輯它。 Q上的流量似乎是相關的。 NLTK是一個開始的好地方。在確定它將成爲一個很好的資源之後,我從iTunes中獲得了一本軟件。如果您在購買之前需要掃描該書,則整件事情都在線NLTK Book但是,如果您認爲它有用,請購買此書。

+1

看看Peter Norvig在他的博客上的所有內容...您在我看來是專門尋找基於語義的tf-idf類型系統(潛在語義分析) – hackartist

+3

對不起,但我認爲您的問題太模糊,在SO上過於寬泛地回答這裏;請參閱[FAQ#dontask]。如果您有更具體的問題(最好涉及一些代碼),請隨時提問! –

+0

在FAQ中這看起來有點狹隘。但是,如果你的動機是「我希望其他人向我解釋______」,那麼你可能沒問題。 – PyNEwbie

回答

1

大衛·羅賓遜建議使用樸素貝葉斯分類器爲您解決問題。這是很好的建議。查看nltk.classify模塊以瞭解NB分類器和其他的實現。

+0

感謝這有助於測試我們是否可以通過這些工具改進我們的成功將會很有趣。其實我只是點擊鏈接,這是完美的。謝謝,我不知道爲什麼我在兩天的觀察中錯過了這個 – PyNEwbie