我使用Ruby和Nokogiri將內容保存在由其CSS選擇器定位的某些標記中。動態清理目標CSS選擇器
但是,我遇到了一個問題,即目標標籤在CSS ID名稱末尾附加了唯一的產品ID。
例子:
a#exampleIdNameB000AQ40M8B00JYWUHO4
在我的劇本,我想這刮信息爲多種產品,所以這個ID會在每次改變,並打破了刮。
具體來說,我越來越喜歡這樣的標籤中的內容:
remove_html_tags(doc.css(html).to_s.strip)
在HTML將它正在搜索的a#exampleIdName
。
有沒有辦法告訴引入nokogiri處理文檔一樣找到a#exampleIdNameB000AQ40M8B00JYWUHO4
:
a#examplIdName
,所以我可以匹配所有的產品頁面?
您需要爲您的輸入提供一個小的HTML樣本,並且輸出格式的例子,你需要,以及你正在使用的代碼的一個合理的例子。做你想做的事並不難,但是浪費我們不得不提出輸入數據的時間,我們可以利用時間來幫助別人。 – 2014-12-07 19:10:32