2011-08-10 93 views
-2

我想使用「。」分割段落。運營商。 但我不想在某些情況下拆分它。喜歡哪裏「。」像「博士」,或「夫人」和「小姐」這樣的詞出現。或幾個其他的話。分割段落

我需要一些邏輯,無論是在C#或SQL  服務器。

+0

儘管如此,並非所有的時段都表示段落結束。你確定在這段時間分裂會完成你所需要的嗎? –

+2

嘗試找到一個邏輯,你將首先能夠用文字表達,然後從那裏開始...... –

回答

1

我讀了一個問題,「我怎麼分割段成它的成分的句子?」,如果這就是你的意思,這裏我將如何處理這個問題:

  1. 打造的「白名單」句子內可接受的句號使用
  2. 將段落分割爲「。」 (稱這些可能的句子)
  3. 遍歷你可能句子,覈對你的白色內句子可接受使用一段時間的列表中結束字符
  4. 如果匹配,結合起來,與下一個可能的句子,並重新進行檢查

不知道你真正的問題集的範圍,我不能說這種方法是否實際可行。

這是一個(possibly) related question,如果您正在研究更強大的英語語言分析器,但該問題是針對Java的。