我有句子的列表:re.findall在列表中的每個句子
[ 'home twn cafe nr link rd',
'taj lands ends hotel..',
'SILVER PALACE705BPALI MALA ROADBANDRA WEST',
'turner rd lemon rd 4 fountain pali rd junctio...',
' FLAT 657 FLOOR AIR INDIA APTS 61B PALI HILL',
'bungalow 9 Mt Mary Bandra West',
'shabbir apt charklie rajan rd abv icici ban...',
'st peters church backyard loun hill rd',
'Union Park Road ',
'Flat 32 Building No 8',
'mehboob studio',
'ONGC Colony',
'Nargis Dutt Road Grand Canyon Building Appa']
我需要使用re.findall找到與「次」的所有單詞,並與「路」取代它們。我嘗試這樣做:
data2 = [nltk.sent_tokenize(lines) for lines in data]
c = [re.findall('nr',sent) for sent in data2]
,我得到這個錯誤:
TypeError: expected string or buffer
我怎麼在迭代語句中使用re.findall
?不知道如何轉換爲字符串.. plz幫助
如果這應該是句子的列表,那你爲什麼要在上面運行一個語句分割器? –
我是一個新手,所以我不知道該怎麼做..第一個陳述是標記每個句子,以便它可以被視爲一個實體。第二個是迭代每個標記句子..請幫助.. –