2015-08-27 67 views
-1

我的程序的工作: 1)從文件test.txt中搜索包含單詞「साधु」的行。 2)在搜索行後,我提取與其右側和左側相鄰的單詞。 3)將這些單詞追加到數組後,我嘗試在這兩個數組中找到相交的單詞。Python中兩個Unicode數組的交點

+0

這是你想要的東西'{」」, '\ XA4', '\ xa5', '\ xe0'}' – The6thSense

+1

交集'設置(數組1)設置(數組2)'即使有印地語字母數組,除非我失去了一些東西..? – thebjorn

回答

2

可以解碼你的字符串與下面的代碼

mylist = map(lambda word: word.decode('utf-8'), mylist) 

雖然交叉口目的爲Unicode,你不需要對它進行解碼。你可以做

#considering you have two lists 'list1' and 'list2' 

intersection = set(list1).intersection(set(list2)) 
+0

對不起,我不適合。你能告訴我如何找到這兩個數組之間的交集? - list1 = [1,2,3,4,'साधु','बालक'] list2 = [1,3,5,6,'साधु','बालक'] – vashi

+0

這是工作,例如你提到的,只有你可能會得到結果作爲字節字符串,而不是unicode對象 – hspandher

+0

@vashi結果=設置(列表1).intersection(設置(列表2)) –