2013-11-22 88 views
1

如果我有一個頻率字典,其中包含文本中的詞作爲鍵和它們在文本中出現的次數作爲值。我怎樣才能得到字數和平均長度,確保考慮到多次出現的單詞?現在我所擁有的僅僅是列出鍵(因爲它們是單詞),然後使用len()進行單詞計數。從頻率詞典獲取字數和平均長度

wordcount=len(list(freq.keys())) 
report["count:"]=wordcount 
#for average length: 
avg=list(freq.keys()) 
average=sum(map(len,avg))/len(avg) 
report["avglen"]=average 
+0

'LEN(頻率)'是足以讓一個字在這裏算。 –

回答

0

使用sum功能和dict.values()

freq = { 'test' : 10, 'rep' : 100 } 
wordcount = sum(freq.values()) 
average = sum(len(w) * c for w, c in freq.items())/wordcount 
print(wordcount, average)