2015-02-11 60 views
0

下面的示例是剝離標點和文字轉換成從ranbo.txt文件小寫...分割字符串用空格,然後做一個計數

幫我用空格來分割這

infile = open('ranbo.txt', 'r') 
lowercased = infile.read().lower() 
for c in string.punctuation: 
    lowercased = lowercased.replace(c,"") 
white_space_words = lowercased.split(?????????) 
print white_space_words 

現在經過這個拆分 - 我怎麼能找到這個列表中有多少單詞?

count or len function? 
+0

'len個(white_space_words)'?當然'lowercased.split(?????????)'會拋出一個異常,無論如何,所以試圖找到返回列表的大小將有點沒有意義... – twalberg 2015-02-11 14:43:55

回答

1
white_space_words = lowercased.split() 

分割使用的空白字符的任何長度。

'a b \t cd\n ef'.split() 

回報

['a', 'b', 'cd', 'ef'] 

但你可以做到這一點還等全面:

import re 
words = re.findall(r'\w+', text) 

返回從text所有 「字」 的列表。

開始使用len()其長度:

len(words) 

,如果你想將它們合成爲一個新的字符串用換行:

text = '\n'.join(words) 

作爲一個整體:

with open('ranbo.txt', 'r') as f: 
    lowercased = f.read().lower() 
words = re.findall(r'\w+', lowercased) 
number_of_words = len(words) 
text = '\n'.join(words) 
+0

怎麼做我添加空白字符(空格,製表符或換行符),然後我怎樣才能得到計數? – 2015-02-11 14:30:57

+0

你想在哪裏添加空格? – eumiro 2015-02-11 14:35:38

+0

之間的單詞....換行b換行c換行... – 2015-02-11 14:38:32

相關問題