尋找關於如何刪除句子中的句點字符但不刪除縮寫句點的一些想法。例如正則表達式在句子結尾處移動句號而不是縮寫
"The N.J. turnpike is long. Today is a beautiful day."
將更改爲:
"The N.J. turnpike is long Today is a beautiful day"
尋找關於如何刪除句子中的句點字符但不刪除縮寫句點的一些想法。例如正則表達式在句子結尾處移動句號而不是縮寫
"The N.J. turnpike is long. Today is a beautiful day."
將更改爲:
"The N.J. turnpike is long Today is a beautiful day"
根據縮寫判斷句子?去BIG:去除所有的點,或去無!
這是一個困難的問題。 Lingua::EN::Sentence
作出了四分之三的嘗試來解決它。它知道美國英語中常見的縮寫,並且有可以添加其他你知道的縮寫。
+ +1爲模塊的建議。如果可以的話,會爲「四分之三」字樣添加額外的+1。 –
正如其他人所說,這是一般情況下的一項非常困難的任務。如果您想了解更多信息,您應該先閱讀更多關於「句子分段」或「句子邊界消歧」的文章,這是將文本分成句子的任務。這裏有幾個鏈接,讓您開始:你爲什麼要在一個末端,除去期間
Def。縮寫。以及如何區分時期。 –
這是非常艱難的。考慮一下「N.J.收費公路很長,今天是美好的一天。」 (注意「Turnpike」中的大寫「T」)。我認爲這不能用正則表達式來處理;一些語義分析將是必需的。 –
你將如何處理'今天我在紐約明天我將在新澤西州' – cjm