我想用java語言從段落中分割句子。考慮下面的句子。 我們決定從我們的辦公室去u.s.a,加拿大,非洲等..我 只有rs.1十萬。所以我打電話給我爸爸,問了一些錢。他說 「No.I wont」並斷開電話 。我使用stanford tokenizer。 Eventhough句子we decided to go to u.s.a, canada,africa etc... from our offic
我想調用uima-text-segmenter https://code.google.com/p/uima-text-segmenter/source/browse/trunk/INSTALL?r=22的API來運行一個例子。 但我不`噸知道如何調用API ... 自述說, With the DocumentAnalyzer, run the following descriptor
`des
所以這基本上是非常簡單的事情,就像在獲取水平投影圖並從中獲取圖像上線條的位置一樣。但問題是,應用的門檻非常不穩定。如果我保持安全的水平,則會提取正確的行數,另一方面提取不需要的結果。 例如這裏是圖像: 而其水平投影: 這裏是我使用來提取文本行的代碼: %complementing as text must be non zero and background should be 0
img_co
我試圖將句段分段。我選擇了'。','?'和'!'作爲分割符號。我想: format = r'((!)|(.)|(?))'
delimiter = re.compile(format)
s = delimiter.split(line)
,但它給了我sre_constants.error: unexpected end of pattern 我也試過 format = [r'(!)',r'(