2015-05-10 73 views
-1

我有以下字符串結構爲: 「電影的名字是美國的名導演的」 我想用在NLTK正則表達式來提取soemthing這樣 [定義模式(下稱「電影名稱 ')] (' 是 ') [(' 美國 ')] (' 執導 ') [(' 名')]模式和正則表達式NLTK

請您在定義模式的幫助,我是新到python和nltk。 謝謝

回答

0

張貼這萬一有人發現它有幫助:

pattern= re.match(r'(.*) is (.*?) directed by (.*?).*', item, re.M|re.I) 

在這種模式的結果將是:

pattern.group(1): film name 
pattern.group(2): category 
pattern.group(3): director name 
+0

很抱歉,但你的問題問題是你所想的方式更難可以使用單個正則表達式(或者甚至是多個)來完成。必須有一本教科書才能完成作業,閱讀它。 – alexis