我有預定義的單詞,並想知道句子的主要主題是關於預定義的單詞。如何確定一個句子是否在談論某個特定主題?
例子:
預定義的單詞: iPhone的Nexus,HTC
一句話:
我喜歡iPhone的新設計 - 首要課題是iPhone
我列出涅槃在我的Nexus上。 - 主要被攝體不在預定義的單詞
的HTC手機比iPhone更好 - 主要對象是HTC
想做到這一點在PHP或者可以讓PHP接口的東西我。
我有預定義的單詞,並想知道句子的主要主題是關於預定義的單詞。如何確定一個句子是否在談論某個特定主題?
例子:
預定義的單詞: iPhone的Nexus,HTC
一句話:
我喜歡iPhone的新設計 - 首要課題是iPhone
我列出涅槃在我的Nexus上。 - 主要被攝體不在預定義的單詞
的HTC手機比iPhone更好 - 主要對象是HTC
想做到這一點在PHP或者可以讓PHP接口的東西我。
Alias-i有一個natural language parser for PHP。
編輯:this page說Alias-i的解析器是用PHP編寫的,但Alias-i的網站說它是用Java編寫的。
簡短版本:按關鍵字。
此方法僅適用於一組有限的關鍵字。
一個相關的問題可能是:Using preg_match to find all words in a list
長版本:通過解析語言,使計算機系統的理解。
後者是語言學家所做的。他們開發這樣的系統需要數年的時間。可能你會發現一些可用的實現,但我不知道任何內存。需要問一個朋友。
試着讓goog heurstic並評估它們。 例子: 1.關鍵字在句首。 2.文本中只有一個關鍵字。 3.是否存在像「litenining」等意外形式的主觀/非信息消息。
在這些功能上寫入分類器。我會推薦Mallet。
只是自己試一試,但不成功 – 2011-06-15 18:17:08
除非你想嘗試爲英語語言實現一個語法,否則你所希望的最好是一個「包含」匹配。其他任何東西都不會超過近似值。嘗試考慮如何指定英語句子主題的所有可能性。 - 編輯 - 是的,這是一個失敗者的方法! – 2011-06-15 18:18:13