2016-07-22 101 views
2

有沒有辦法與多個科目,如分隔一個複合句:將複合句子與多個主題分成多個句子,每個主題各有一個主題?

  • 我是一個人,你是一個人。 =>我是一個人。你是一個人。
  • 狗有時吃奶酪,它是拉布拉多犬。 =>狗有時會吃奶酪。這是拉布拉多犬。

我正在考慮使用分析樹和識別多個主題來分離它,但我不確定如何創建一個通常可靠地完成此操作的算法。

回答

2

您需要確定結締組織及其類型(隱性/明確的結締組織),並用一句選區解析樹識別結締組織的論點。

例子:

(1)我是人,你是一個人。

(ROOT 
    (S 
    (S 
     (NP (PRP I)) 
     (VP (VBP am) 
     (NP (DT a) (NN human)))) 
    (CC and) 
    (S 
     (NP (PRP you)) 
     (VP (VBP are) 
     (NP (DT a) (NN human)))) 
    (. .))) 

=>在這裏,你可以看到,的S - >取值CC小號。這意味着使用CC連接的兩個參數都是句子本身。所以你可以直接將它們從CC中分離出來。

=>你會得到2句話。

1)我是人2)你是一個人

(2)約翰去酒店和共進午餐。

(ROOT 
    (S 
    (NP (NNP John)) 
    (VP 
     (VP (VBD went) 
     (PP (TO to) 
      (NP (NNP Hotel)))) 
     (CC and) 
     (VP (VBD had) 
     (NP (NN lunch)))) 
    (. .))) 

=>以下,VP - > VP VP CC,意味着結締組織被用於連接兩個動詞組和它們具有共同的課題。因此,您可以在兩個句子中使用相同的主題並添加一個VP。

=>結果將是,

1)約翰來到酒店2)約翰共進午餐

(3)約翰吃蘋果和香蕉。約翰和邁克吃了蘋果。

(ROOT    #John ate apple and banana. 
    (S 
    (NP (NNP John)) 
    (VP (VBD ate) 
     (NP (NN apple) 
     (CC and) 
     (NN banana))) 
    (. .))) 

(ROOT    #John and Mike ate apple. 
    (S 
    (NP (NNP John) 
     (CC and) 
     (NNP Mike)) 
    (VP (VBD ate) 
     (NP (NN apple))) 
    (. .))) 

=>以下,NP - > NN CC NNNP-> NNP CC NNP這意味着CC連接兩個神經網絡/既專業NNP可以單獨被使用。所以你可以拆分這些NN/NNP。

=>您將在蘋果2得到這樣的句子,

1)約翰吃蘋果2)約翰吃了香蕉[和]

1)約翰)麥克吃蘋果

0

你必須努力工作。你可以使用POStagger和Parse樹來實現這一點。

here的您如何提取使用opennlp

這很容易安裝和使用,你可以按照這個blog

現在你知道如何提取使用POS句子的部分名詞,形容詞和動詞,它一定更容易達到你想要的。

希望這有助於!