在python中,我試圖將一個文本文件。搜索每個角色,當我找到一個大寫字母時,我想跟蹤字符數,直到找到'?','!'或'。'。基本上,我正在閱讀大量的文本文件,並試圖計算出有多少句子以及總字符來查找平均句子長度。 (我知道會有一些錯誤的東西,如先生或EG,但我可以用蟲子生活。該數據集是如此之大,誤差可以忽略不計。)如何在條件之後對字符進行計數?
char = ''
for line in sys.stdin:
words = line
for char in words:
if char.isupper():
# read each char until you see a ?,!, or . and keep track
# of the number of characters in the sentence.
http://stackoverflow.com/questions/3549075/regex-to-find-all-sentences-of-text – 2015-04-04 00:28:07
你是否正在計算跨越換行符,還是句子完全在給定的行內? – geoelectric 2015-04-04 00:41:56