所以我有這些網址不斷變化:Python的正則表達式來刪除URL中不需要的部分
http://news.google.com/news/url?sa=t&fd=R&usg=AFQjCNFcQAQ4S3H5xUuU4N-LoM2I9tLxJg&url=http://www.washingtonpost.com/blogs/going-out-guide/wp/2013/11/08/dallas-buyers-club-thor-the-dark-world-and-other-new-movies-reviewed/
但我想脫掉變化的第一部分和一下就只剩下:
http://www.washingtonpost.com/blogs/going-out-guide/wp/2013/11/08/dallas-buyers-club-thor-the-dark-world-and-other-new-movies-reviewed/
我會用什麼正則表達式去除所有的東西?
我不能使用「startswith()」,因爲這個URL中的「usg」數字發生了變化。
有什麼問題['urlparse.parse_qs()'](http://docs.python.org/2/library/urlparse。 html#urlparse.parse_qs) –
@MartijnPieters你打算把它當作答案...... :) –
@Jon:現在完成了...... –