我正在處理一個非常大的列表,大小約爲56,000個元素(所有字符串)。我試圖減少運行時間。基於列表中的第i個元素快速創建布爾數組
有一種方法以縮短此行: X = [INT(i的列表2),其中i在列表1]
給定字(list1的)和一些句子(列表2)的一些字典, 林試圖創建一個基於句子的二進制表示,如 [1,0,0,0,0,0,1 ........ 0]其中a 1表示字典中的第i個詞出現在句子中。
最快的方法是什麼?
示例數據:
dictionary = ['aardvark', 'apple','eat','I','like','maize','man','to','zebra', 'zed']
sentence = ['I', 'like', 'to', 'eat', apples']
result = [0,0,1,1,1,0,0,1,0,0]
請張貼一些樣本數據。 – 2013-05-06 07:09:53
因此,句子列表包含「單詞」而不是句子。句子是空格分隔的字符串。 – 2013-05-06 07:28:23
是的,我有超過10萬個句子,現在每個句子都代表一個包含它們的單詞列表。我現在需要將這些句子中的每一個表示爲布爾數組,其中在第i個索引處的布爾值爲1表示在該句子中存在我之前創建的詞義分析器中的第i個詞。 – user2353644 2013-05-06 07:36:25