我有一些文本,即時嘗試解析文件。檢測文本解析是否爲句子或編號列表
考慮這個文本文件:
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
1. Line 1
2. Line 2
+ Line 1
+ Line 2
+ Line 3
有三段在文本文件中。
首先是一對句子。 第二個人有一個句子和一個編號列表。 三是一個簡單的項目符號列表。我的問題是,在Objective-C中,我怎樣才能弄清楚段落組合,如果它只是句子,我會將它們作爲NSString返回,如果它的項目符號列表,我希望它們在NSArray中分開,如果段落是句子和編號列表的組合,我將它們作爲NSString和NSArray的字典返回。
任何想法?我知道我可以使用正則表達式來出來分成數組或字符串,但我不太知道如何檢測並驗證是否對位是:
- 第(句子)
- 子彈名單/編號列表。
- 組合列表和帕拉
我已經讀了一堆教程和關於regexpressions SO問題後嘗試這樣做。
此表達(?=\d*\s*[\.]?\s*)([a-z\s]+)
確實獲取編號列表,但它也抓住列表之前的前面的文本。那就是我完全陷入困境的地方。
你確實寫人 – jasonIM