2013-04-20 26 views
-4

假設我有一個字符串"I am a good boy"。我希望字符串中每個字母的總數。字母區分大小寫。即Dd需要被認爲是兩個不同的字符。使用紅寶石句子中的字母數目

+5

在堆棧溢出中,期望您顯示您編寫的代碼以嘗試解決問題。這個問題在這裏經常被問到,所以一些搜索應該已經出現了很多如何實現它的例子。 – 2013-04-20 21:24:25

+3

這確實看起來像我的作業 – 2013-04-21 07:29:34

回答

18
"I am a good boy".scan(/\w/).inject(Hash.new(0)){|h, c| h[c] += 1; h} 
# => {"I"=>1, "a"=>2, "m"=>1, "g"=>1, "o"=>3, "d"=>1, "b"=>1, "y"=>1} 
+2

+1這是我該怎麼做。它很直接,很重要。 – 2013-04-20 20:26:53

+1

@sawa不需要你的寶貝,因爲寶石內部這樣做。您可以將該代碼複製爲答案。我將使用'gem'。@ Logan已經鏈接了該代碼。 – 2013-04-20 20:29:37

+0

@TheMiddleMan不,我不會。我已經有我的了。沒有必要。 – sawa 2013-04-20 20:31:06

14
a = "I am a good boy" 

a.chars.group_by(&:chr).map { |k, v| [k, v.size] } 
+1

+1另一個**好的**解決方案。 – squiguy 2013-04-20 21:57:28

+0

@ muistooshort,因爲'a.chars.group_by(&:chr).map {| k,v | [k,v.size]}'我不認爲刪除了'空白區域'。 – 2013-04-20 22:01:17

+3

「,因爲我認爲a.chars.group_by(&:chr).map {| k,v | [k,v.size]}沒有移除空格。」什麼?!這與空間無關。 'chars'是一個字符串中單個字符的迭代器。 'group_by(&:chr)'組,並返回一個散列,其中每個字符鍵的值都是相同字符出現的數組。 'map'將每個散列轉換爲數組的字符和大小。 'to_a'沒有必要,但可能是習慣。 「排序」是一種方便。 – 2013-04-20 22:27:42

6

我會使用:

 
str = "I am a good boy" 
str.scan(/[[:alpha:]]/i).each_with_object(Hash.new(0)) { |c, h| h[c] += 1 } 

將返回:

 
{ 
    "I" => 1, 
    "a" => 2, 
    "m" => 1, 
    "g" => 1, 
    "o" => 3, 
    "d" => 1, 
    "b" => 1, 
    "y" => 1 
} 

我更喜歡使用scan,因爲它會立即使用正則表達式來確定哪些字符允許被算作。如果輸入字符串包含「我是個好孩子」。一些其他的解決方案會失敗,因爲它們對於輸入字符串來說過於具體,並且每次遇到意外字符時都需要調整。我們知道,輸入很少是無效的,在現實世界中,這種代碼將用於一般句子。預先忽略不需要的字符很重要。


 
'Français'.scan(/[[:alpha:]]/i).each_with_object(Hash.new(0)) { |c, h| h[c] += 1 } 

將返回:

 
{ 
    "F" => 1, 
    "r" => 1, 
    "a" => 2, 
    "n" => 1, 
    "ç" => 1, 
    "i" => 1, 
    "s" => 1 
} 
+2

+1 [[alpha:]] – AJcodez 2013-04-20 22:24:27

+0

你執行了一個單一的搜索,在那裏我所有的章程,除了'白色空間'計數。但請記下您創建新對象的次數?我沒有。這裏是我的代碼去效率列表。 – 2013-04-20 22:43:48

+0

我創建了一個新對象多少次?詳細解釋這一點,以便我們都可以從您對如何算法不好的知識中受益。 – 2013-04-21 14:34:36

8

這並不意味着是一個答案,只是除了現有的答案。

由於討論了性能,下面是一些數據。

require 'benchmark' 

s0 = "I am a good boy" 
s = s0 * 1 
N = 10000 

Benchmark.bm(20) do | x | 
    x.report('sawa') do 
    N.times { s.scan(/\w/).inject(Hash.new(0)){|h, c| h[c] += 1; h} } 
    end 

    x.report('digitalross') do 
    N.times { s.chars.to_a.sort.group_by(&:chr).map { |k, v| [k, v.size] } } 
    end 

    x.report("digitalross'") do 
    N.times { s.chars.group_by(&:chr).map { |k, v| [k, v.size] } } 
    end 

    x.report('rubylovely') do 
    N.times { s.gsub(/\s/,'').chars.with_object({}) {|c,ob| ob[c] = s.count(c)} } 
    end 
end 

給(ruby 1.9.3p392我的機器上)

      user  system  total  real 
sawa     0.600000 0.000000 0.600000 ( 0.601734) 
digitalross   0.790000 0.000000 0.790000 ( 0.806674) 
digitalross'   0.640000 0.010000 0.650000 ( 0.651802) 
rubylovely    0.570000 0.000000 0.570000 ( 0.572501) 

隨着s = s0 * 1000N = 10我得到

      user  system  total  real 
sawa     0.340000 0.000000 0.340000 ( 0.340617) 
digitalross   0.380000 0.000000 0.380000 ( 0.411393) 
digitalross'   0.230000 0.010000 0.240000 ( 0.243389) 
rubylovely    6.530000 0.000000 6.530000 ( 6.603198) 

所以很短的字符串,RubyLovely的解決方案的重複計算不受到傷害。實際上,它確實如此。

+0

順便說一句,我刪除了我的答案。但是,感謝您展示「Benchmark」報告。 – 2013-04-21 05:01:19

3

我沒有看到拼寫出一段代碼有什麼問題,因此任何Ruby程序員(包括新手)都很容易理解它。而且,我想對這個字符串進行一次傳遞。

所以,我喜歡這樣的:

s = "I am a good boy" 

def count_word_characters(s) 
    h = Hash.new(0) 
    s.each_char do |char| 
     next unless char =~/\w/ 
     h[char] += 1 
    end 
    h 
end 

因爲:

  • 可以很容易地看到散列h的創建,填寫,並輸出
  • 散列h被填充在一個通通過輸入字符串
  • 很明顯,我們正在跳過非單詞字符