2017-02-14 153 views
1

我試圖糾正這個代碼,並不斷得到蟒蛇正則表達式,後面

sre_constants.error: look-behind requires fixed-width pattern 

請幫我擺脫這種錯誤的正面看...我所試圖做的是讓數這是變量w2,緊接在變量w的單詞後面。

import requests 
import re 
import bs4 


def verse(book, chapter): 
     html = requests.get("http://www.holybible.or.kr/B_NIV/cgi/bibleftxt.php?VR=NIV&VL={}&CN={}&CV=99" 
          .format(book, chapter)).text 
     bs = bs4.BeautifulSoup(html, 'html5lib') 
     ol = bs.findAll('ol') 
     section_cnt = int(ol[-1].attrs['start']) + len(ol[-1].findAll('li')) - 1 
     w = re.search(r'(?<=height=12>\s<b>)(\d+\s)?[a-zA-Z]+\s[0-9]+', html).group() 
     w2 = re.search(r'(?<=height=12>\s<b>(\d+\s)?[a-zA-Z])+\s[0-9]+', html).group() 

     print(w, 'has', w2, 'chapters', section_cnt, 'verses') 

if __name__ == '__main__': 
    verse(1, 27) 
+0

從[re](https://docs.python.org/2/library/re.html)的文檔中,'()'是一個特殊字符。如果你匹配的是(),你將需要用'\'來轉義它。 –

回答

2

你不需要在這裏看起來後面。

使用

(?:height=12>\s<b>(?:\d+\s)?[a-zA-Z]+)(\s[0-9]+) 

觀看演示。

https://regex101.com/r/k1cYXS/1

獲取group 1來代替。

w2 = re.search(r'(?:height=12>\s<b>(?:\d+\s)?[a-zA-Z]+)(\s[0-9]+)', html).group(1)