0
這是我想正則表達式(。):正則表達式匹配點結尾的西班牙語單詞,並強調
([\w\s\/áéíóúüñçåÁÉÍÓÚÜÑÇÐ\-]+)(\.\_)
這裏有兩個例子,它應該對陣:
EL羅薩里奧/ ESCUINAPA._精讀POCOMÁS德4萬個比索......
和
Cuautitlán._精讀POCOMÁS德4萬個比索......
表達適用於第一個例子,但不是因爲編碼可能是第二:
docHtml = urllib.urlopen(link).read()
#using the lxml function html
tree = html.fromstring(docHtml)
newsCity = CSSSelector('#pid p')
try:
city_paragraph = newsCity(tree)
city_match = re.search('([\w\s\/áéíóúüñçåÁÉÍÓÚÜÑÇÐ\-]+\._)',city_paragraph[0].text)
嘗試刪除您的模式中的'^'。 –
爲什麼你有^?如果該單詞是該行中的第一個,那隻會匹配。 – acarlon
編輯q。謝謝 –