在Python中使用Zipf類選擇從列表中選擇元素

是否可以使用Python在Zipf分配之後從列表中選擇一個元素？在Python中使用Zipf類選擇從列表中選擇元素

假設我有一個列表：

objlist = ['Here', 'in', 'the', 'wall', 'why']

到目前爲止，我所看到的https://docs.scipy.org/doc/numpy/reference/generated/numpy.random.zipf.html 但我不能找出解決方案。

在此先感謝。

來源

2017-02-02 Antonis

你的意思是這些單詞在英語中的實際頻率？ –

是的。我想根據zipfs分佈選擇元素。如果我理解你的問題 – Antonis

只需使用numpy.random.zipf(shape_parameter)的輸出作爲列表的索引。但是，有一個問題，zipf分發是未綁定的，並且該值可能比您的索引大。因此將其插入到try:except:塊中。
當您多次運行您的代碼時，會在您的列表中繪製不同的值。但是，由於zipf分配是未綁定的，並且您的列表索引不是，它不會完全zipf分佈。

Saple代碼：

objlist = ['Here', 'in', 'the', 'wall', 'why'] 
index = np.random.zipf([1.2, 1.2]) 
for idx in index: 
    if idx < len(objlist): 
     print(objlist[idx]) 
    else: 
     print "Index {} exceed list".format(idx)

Wikipedia: Zipf Distribution

來源

2017-02-02 09:12:43 UpSampler

嗯有趣的建議。是否可以設置一個代碼示例？這對我來說有點棘手，因爲我無法理解分配。 – Antonis

非常有用。最後一個問題。如果我想根據此選擇2個值，那麼如何實現這一點？ – Antonis

如果你喜歡它，請接受答案並點贊。這是爲你沒有支付的工作獎勵一些獎勵;） – UpSampler

我希望我不是誤會你的要求，這裏是我的代碼：

import random 
objlist = ['Here', 'in', 'the', 'wall', 'why'] 
print random.choice(objlist)

來源

2017-02-02 09:17:38 MichalM

這只是隨機選擇價值。我想要按照選擇的拉鍊分佈。 – Antonis

要根據實際經驗齊普夫分佈選擇，你首先需要一張英文單詞頻率表。如果最頻繁的10萬人會，你可以得到一個here。

這是一個PDF，文本更容易處理，所以它轉換，在Linux上，你可以做

pdftotext freq100000.pdf

這將創建一個文本文件freq100000.txt，您可以使用下面的小腳本

import re 
import numpy as np 

record = re.compile('[0-9]+ [0-9]+ [a-z]+') 
data = {} 
for line in open('freq100000.txt'): 
    m = record.match(line.strip()) 
    if not m is None: 
     rank, freq, word = m.group(0).split() 
     data[word] = int(rank), int(freq) 

def rel_freqs(wlist): 
    freqs = np.array([data[word.lower()][1] for word in wlist]) 
    ps = np.add.accumulate(freqs) 
    choice = np.searchsorted(ps, np.random.randint(ps[-1])) 
    return choice 

rel_freqs(['Here', 'in', 'the', 'wall', 'why'])

函數rel_freqs從列表中隨機選擇一個單詞並返回其索引。繪製單詞的概率與英語中出現的頻率成正比。

來源

2017-02-02 10:07:30

好吧，我明白你的觀點，並感謝你。但我是新手分配，我與這個例子糾結。我想適應這種情況，以防我的名單，這是困難 – Antonis

好吧，讓我們一步一步來試試：你成功（1）下載字典？（2）將其轉換爲文本？（3）運行腳本？ - 我將添加一行顯示函數調用。 –

好吧，我明白了。 +1。我會嘗試。謝謝。 – Antonis

在Python中使用Zipf類選擇從列表中選擇元素

回答

相關問題