2008-12-11 43 views
3

我與Yahoo! pipes鬼混,我用一些正則表達式打牆。現在我熟悉Perl的正則表達式,但是這些規則在Yahoo!中似乎有所不同。管道。在Yahoo!上正則表達式管道

Screen shot of my pipe http://lanzkron.googlepages.com/pipe.PNG

我在做什麼是抓取的網頁,並試圖把它變成一個飼料,我從HTML剝離出來的鏈接正則表達式工作正常,但我想要的標題是什麼在<i>標籤只是輸出原始文本。

在Perl和這個 online regexp tester匹配

示例文本:

<一個相對= 「nofollow」 目標= 「_空白」 HREF =「http://changed.to/protect/the-guilty。 HTML 「> <我> 」收費網絡連接佛樂「(英國文豪)< /我> </A >(另見本其他網站<一個rel = 」nofollow「 的目標= 」_空白的「 href =」 HTTP://計算器.com「> Nada </a >)其他文字

回答

6

正則表達式的標題:

(?i).*?<i>([^<]*).*    [ ] g [x] s [ ] m [ ] i 

正則表達式的鏈接:

(?i).*?href="([^"]*).*   [ ] g [x] s [ ] m [ ] i 

不知何故不區分大小寫的複選框似乎打破。幸運的是,你可以用(?i)替代,這很好用。

這是一個很好的web2.0-ish工具來測試正則表達式:RegExr。但由於某種原因,它仍然是測試版。 ;-)

2

YP需要注意的一件重要的事情是不要相信調試屏幕,它有一個隱藏一些標記的小怪癖,它可以在嘗試重新編碼時不會造成混淆。揭露任何隱藏的html用'#'代替'<'

相關問題