我試圖從新聞文章中提取標題。問題是新聞網站通常會在標題中添加連字符和公司名稱,所以我試圖製作一個正則表達式來匹配空格,連字符,空格及其後的所有內容。例如:使用正則表達式匹配連字符後的所有內容
'Minecraft - Xbox 360 Edition' future mash up packs and Xbox One updates posted - National Video Game News
比賽
- National Video Game News
我想讓它只有當一切都包含最多4個字後後的正則表達式匹配的空間+連字符+空間和一切以大寫字母開頭。我試圖使用負先行排除與小寫開頭的單詞:
\s-\s(?!([a-z]+\s){3,}[a-z]+).*
但它的空間,第一個連字符及其之後的所有比賽:
- Xbox 360 Edition' future mash up packs and Xbox One updates posted - National Video Game News
我不知道在這裏做什麼,有人可以幫忙嗎?
謝謝你,我最不善於用正則表達式。 – user2517599