1
好吧,我有一個RSS源。每篇文章都包含多個HTML鏈接。他們都是同一個主機(例如youtube.com),並且有一個主機不同。 我想過濾這一個鏈接。使用RegEx過濾來自Feed的特定鏈接
因此,在這一刻,有我的最常見的主機規則(imgur,減,tumblr等)的列表,它看起來像這樣:
(?i).*?href="(https?://[^"]*host1[^"]*).*
(?i).*?href="(https?://[^"]*host2[^"]*).*
(?i).*?href="(https?://[^"]*host3[^"]*).*
的問題是:有時總是與未知主機的鏈接。 所以我想要做的是將所有其他鏈接(都是相同的)「列入黑名單」。我讀到(?!regex)
但它似乎不工作:
(?i).*?href="(https?://[^"]*(?!youtube)[^"]*).*
我希望你明白我的問題,我的(可能)的英語不好對不起!
你使用什麼編程語言? –
我在Yahoo Pipes上使用Regex ... –