我將如何使正則表達式只獲得單詞「標題」,並過濾掉其餘的。URL正則表達式開始和結束與
標題可以改變
例子:
http://blogx.blogspot.com/2012/04/TITLE.html?showComment=13348745236XXXXXXX
我得到了什麼:
http://[a-z{1,20}].blogspot.com/{4}/{2}/______\.(.*)$
我將如何使正則表達式只獲得單詞「標題」,並過濾掉其餘的。URL正則表達式開始和結束與
標題可以改變
例子:
http://blogx.blogspot.com/2012/04/TITLE.html?showComment=13348745236XXXXXXX
我得到了什麼:
http://[a-z{1,20}].blogspot.com/{4}/{2}/______\.(.*)$
試試這個
blogspot\.com\/.*?([^\/]+)\.html
([^\/]+)
是一個否定的字符類,將不是一個斜槓,直到出現「 html的」匹配任何內容。
你會發現在捕獲組「標題」 1
你嘗試了其他的問題,除了缺少標題部分
http://[a-z{1,20}].blogspot.com/{4}/{2}/______\.(.*)$
^^^^^^^ ^^^ ^^^
的量詞必須是外人物類。
你在這裏只提供了量詞。這將匹配7 /
連續(順便說一句,取決於你的正則表達式風格和/或正則表達式分隔符,你需要跳過斜線)。
使用您正則表達式的解決方案可能看起來像
http://[a-z]{1,20}.blogspot.com/\d{4}/\d{2}/([^\/]+)\.(.*)$
看到它在Regexr
(?<=http://blogx\.blogspot\.com\/\d{4}/\d{2}/).*?(?=\.)