我想從使用書籤服務Delicious轉向Diigo,但diigo在其RSS中組織標籤的方式阻止了此舉。使用Yahoo管道將RSS html標籤轉換爲標準標籤項目
我想使用雅虎管道打開的diigo RSS標記成相同的格式,美味的RSS標籤
的diigo標籤存儲在「說明」項底部的HTML列表,像這樣:
Some test describing the link.
<p class="diigo-tags"><strong>Tags:</strong>
<a rel="nofollow" target="_blank" href='https://www.diigo.com/user/username/firsttag'>firsttag</a>
<a rel="nofollow" target="_blank" href='https://www.diigo.com/user/username/2ndtag'>2ndtag</a>
<a rel="nofollow" target="_blank" href='https://www.diigo.com/user/username/anothertag'>anothertag</a>
etc... </p>
我需要提取其中的每一個並將它們存儲在它們自己的項目中。美味存儲在嵌套字段類別每個標籤由數,這樣的:
category
0
domain http://delicious.com/username/
content firsttag
1
domain http://delicious.com/username/
content 2ndtag
所以,雅虎管需要剝去HTML列表和每個標籤分離成單一類別字段。
不知道從哪裏開始,除了可能在正則表達式正則表達式剝去HTML:
(?si)<a[^<>]*?[^<>]*>(.*?)</a>
任何意見讚賞。
請將鏈接添加到您的文章 – janos
我在這裏做了一個管道,但它不包含太多。很好的方法來比較Diigo和Delicious的輸出:https://pipes.yahoo.com/machinemachine/8fcfdf5dc9401fb5c6559e4f5d191dfe – therourke