2016-03-23 105 views
0

以下面的句子作爲〔實施例(從GATE官方幻燈片教程得到:模塊11 https://gate.ac.uk/sale/talks/gate-course-may10/track-3/module-11-ml-adv/):GATE如何處理機器學習(文本分類)?

我被告知,該項目是在股票和可次日送貨。幾天後,我追查他們被告知有錯誤,沒有存貨。幾天後再次追趕,仍然沒有股票,然後發現他們從一開始就給我發了賬單。所以他們有我的錢一個星期以上 - 不知道他們什麼時候會有股票 - 我已經完成了所有的追逐。儘管別人說在八年的互聯網購物最糟糕的經歷到目前爲止沒有。

當GATE機器學習PR(批量學習)中的整個句子被標記爲anntation並作爲實例對待時,GATE如何處理學習過程?

我有兩個猜測。一個是GATE自動地爲句子中的每個單詞添加人類語義,並收集這些特徵來建立一個分類模型。另一個是GATE簡單地將句子變換爲數學變量,如向量,並根據語言學特徵訓練模型,如使用多少個名詞,adj,adv。

我不確定哪一個是正確的,或者是否會有另一個解釋。希望有人可以提供確認或任何相關信息。

謝謝!

回答

0

GATE根據您在配置xml文件中的定義構建模型。除了實例類型之外,可能會有像Token(具有root,POS,...)或N-gram或由JAPE規則創建的自己的註釋(帶有功能)的註釋。 Gate將使用你的定義並建立一個模型。

+0

謝謝ashingel。但是如果實例或我自己的註釋是短語或句子,它們會被分成單個單詞來進行機器學習的特徵提取嗎? –