2014-06-19 44 views
1

我有一個新的即將到來的需求,我們必須在一個事務和流程中處理一個給定的描述,以打破預定義的類別。如何使用NLP處理簡短描述

該描述是對醫生處方的描述。

例如「服1丸,每天早上30天」「每次1粒,一天兩次,兩週」

注意這些描述必須被分解成類地說如。 時間重複類藥物的,服用方式。

我想使用apache ONLP。

請提出如何在這個問題上前進,以使其更準確,因爲解決方案必須是準確的。

+1

嘗試ONLP。看看它是否適合您的用例 – CocoNess

+1

我可以從測試數據或僞數據創建樹模式,然後嘗試識別給定數據上的所有類型的模式。以便處理 – user3709980

回答

1

請看看cTAKES,一個開源項目。他們正在做你想做的事情。
您可以使用Finite State Machine來實現此目的。
指導this指導,設置此cTAKES項目。
另請參閱this javaDoc爲藥物頻率單位。

2

你想做什麼,在計算語言學術語中稱爲信息提取。你可以諮詢this頁面的初學者。