2011-07-21 92 views
0

我想從文本數據中提取大小(「導彈長五十五英寸」或「他重九磅半」),並將它們轉換爲可用格式的數據由一個程序。從文本數據解析大小

這是怎麼回事? 是否有任何有用的庫?

這個任務有多複雜?

回答

0

您可以將此視爲信息提取(IE)問題。在這種情況下,基本方法是制定一系列正則表達式來描述這個問題,然後對這些問題進行細化,直到它們足夠好或者你不能再進一步。

或者,你可以您最喜歡的解析器,看看它會產生什麼樣的樹/依賴結構爲你後的句子,找出一般模式,檢查以及它如何不,也許過濾與結果正則表達式或返回結構上的謂詞。