2012-05-28 159 views
1

您能否給我一個關於什麼是使用R計算字符串中元音的絕對和相對頻率的最好和最簡單的方法的提示?使用R計算元音的頻率

我猜這個源代碼與我在Java論壇上發現的有點不同。

+0

您能否給我一個關於您的數據是什麼樣的以及您已經嘗試過的提示? – Andrie

+0

你好Andrie, 不是太多,因爲我對R很新,並且沒有編程經驗。 我們已經像一個句子 我們首先引起的使用子串函數字母數:SEQ(1 字母=串(S,(S),1),SEQ(1(S),的nchar,NCHAR 1)) 現在我們正在爲每個循環提取字符串中的每個元音的頻率 ,例如: for int i = 0;我

+0

{if(x [[i]] =='a'|| =='A')a ++; .. –

回答

12

設置一些數據:

text <- "Can you please give me a hint on what's the best and easiest way to compute the absolute and relative frequencies of vowels in a string using R? 

I guess the source code is a bit different from what I've found so far in the forum concerning Java. 

Any help is appreciated." 

分析它:

x <- tolower(strsplit(text, "")[[1]]) 
x <- x[x %in% letters] 

絕對頻率:

table(x) 
x 
a b c d e f g h i j l m n o p q r s t u v w y 
19 3 8 6 29 8 5 8 17 1 5 4 16 14 5 1 11 16 17 9 5 4 3 

相對頻率:

table(x)/length(x) 
x 
      a   b   c   d   e   f   g   h   i 
0.088785047 0.014018692 0.037383178 0.028037383 0.135514019 0.037383178 0.023364486 0.037383178 0.079439252 
      j   l   m   n   o   p   q   r   s 
0.004672897 0.023364486 0.018691589 0.074766355 0.065420561 0.023364486 0.004672897 0.051401869 0.074766355 
      t   u   v   w   y 
0.079439252 0.042056075 0.023364486 0.018691589 0.014018692