2014-05-21 101 views
-2

我必須在表格佈局中的文本中找到發生最多的字母。查找文本中的最高頻率字母

我被給了這個幫助,但我不知道如何使用它。

letter.count <- function(text, letters) { 
## count the number of times letters appears in the text 
return(sum(unlist(strsplit(text, "")) %in% letters)) 
} 

該數據是一組推文,我必須找到樣本平均頻率。 數據表被設置爲使得推文位於一側而消極位於另一側。我已經設法隔離所有推文的負面推文,現在我只需要找到所有推文的最常見的字母。

+4

這是一個家庭作業的問題嗎?你知道'letter.count'函數的作用嗎? – MrFlick

回答

1

你可以做這樣的事情,與table

locate.letters <- function(text, letters){ 
    x <- unlist(strsplit(text, '')) 
    tt <- table(x[x %in% letters]) 
    list(table = tt, sum = sum(tt), max = tt[which.max(tt)]) 
} 

> txt 
## [1] "I am a geography student. I am interested in mining tweets for 
## geographic data in support of my thesis on the new Geography. I know maps 
## are being developed by some developers. I would like to be able to 
## develop maps myself. How do I do that? What is the process? 
## Thanks in advance." 

> locate.letters(txt, letters[1:10]) 
## $table 

## a b c d e f g h i 
## 17 4 3 11 30 3 7 9 11 

## $sum 
## [1] 95 

## $max 
## e 
## 30