檢查一行中的字母是否可以組成一個詞

我想檢查示例測試文件中的每一行是否可以組成一個特定的詞「aardvark」。例如給定此示例文本：檢查一行中的字母是否可以組成一個詞

No aardv*rks here! 
Only armadillos and anteaters. 
Animals are run down: very awful road kill. 
I prefer a quick guacamole made from avocados.

應該打印出來：

Aardvark on line 3 
Aardvark on line 4

由於在3線和4在該行的字母可以使字「土豚」

這是我到目前爲止，我已經從示例文本中的1到行數有多少。我不知道該從哪裏繼續。

lines_counter = 0 
with open ('input.txt') as f: 
    for line in f: 
     if line != '\n': 
      lines_counter += 1 
for c in range(1,lines_counter+1): 
    print(c)

我也寫了這個，我不認爲這會工作。但我想:(

for c in f: 
    a = c.count('a') 
    r = c.count('r') 
    k = c.count('k') 
    d = c.count('d') 
    v = c.count('v') 
    h = a + r + k + d + v

來源

2014-08-30 Small Log

這是功課？如果你不得不寫下你要怎麼做的話。其實寫在你的問題，然後把它變成代碼。我會幫你的。 – will 2014-08-30 13:46:37

你能幫我解決這個問題嗎？不，它不是功課，只是我想要做的:) – 2014-08-30 13:48:10

'如果所有（a.count（x）<= line.lower（）。count（x） 'a =「aardvark」' – 2014-08-30 14:08:48

您可以使用collections.Counter這樣的：

from collections import Counter 

with open ('input.txt') as f: 
    for idx, line in enumerate(f): 
     if line != '\n': 
      counter = Counter(line.lower()) 
      counter.subtract('aardvark') 
      if min(counter.values()) >= 0: 
       print('Aardvark on line %d' % (idx + 1))

來源

2014-08-30 13:48:23

if min（counter。values（））> = 0： – Cld 2014-08-30 14:06:47

@Cld是的，但我正在重寫它，以保持它更簡單;） – 2014-08-30 14:07:25

對不起，但它更復雜... – Cld 2014-08-30 14:13:18

讓我們與NumPy做的這一切，我們需要的是一個簡單的轉換功能：

import numpy as np 
def charfreq(s): 
    """Return array with the frequency of each ASCII character from 0 to 127.""" 
    a = np.array(s, 'c').view(np.uint8) 
    return np.bincount(a, minlength=128)

對於字符串「aardvark」這給了我們：

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
     0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
     0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
     0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
     0, 0, 0, 0, 0, 3, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 2, 
     0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0])

注意位置97處的3，即ord('a')。因此，我們需要三個「一」 S等

現在，只需將您的兩個字符串，我們想找到針和乾草堆中找到它：

needle = charfreq('aardvark') 
haystack = charfreq('Animals are run down: very awful road kill.')

現在我們有兩個數組，所有剩下的就是比較它們：

np.all(needle <= haystack)

返回true ...但要注意區分大小寫;如果你想不區分大小寫，你可能希望在使用它們之前小寫字符串。

來源

2014-08-30 14:04:37

有點晚了，但是：

with open(file_name, 'r') as f: 
    lines = map(set, f.readlines()) 

for i in range(len(lines)): 
    line = lines[i] 
    if set('aardvark').issubset(line): 
     print('Aardvark on line '+str(i+1))

這使用套，這是無序列表。

來源

2014-11-16 12:42:30

這可以更容易，因爲Counter返回0如果你問一個關鍵不在它：

from collections import Counter 
a = Counter("aardvark") 
for pos, string in enumerate(strings): 
    c = Counter(string) 
    if all(c[letter] >= a[letter] for letter in a): 
     print("Aardvark on line", pos+1)

輸出：

Aardvark on line 3 
Aardvark on line 4

來源

2014-11-16 13:13:27

檢查一行中的字母是否可以組成一個詞

回答

相關問題