在這裏掙扎着一些正則表達式。我將循環瀏覽幾個網址,但我無法獲得如何識別收入或成本並獲取它們的正則表達式。本質上,輸出會是這個樣子:或用正則表達式和python解析url時的語法
import re
url = ['GET /ca.gif?rb=1631&ca=20564929&ra=%n&pid=&revenue=224.00&cost=',
'GET /ca.gif?rb=1631&ca=20564929&ra=%n&pid=&revenue=224.00',
'GET /ca.gif?rb=1631&ca=20564929&ra=%n&pid=&revenue=224.00&cost=13']
values = []
for i in urls:
values.append(re.search(r'(?<=revenue=)(.*?)(?=&|;)',url).group(0))
print values
[[224.00, ''],
'224.00',
[224.00, 13]]
我認爲最後的列表是您的預期輸出。 –