2015-11-29 62 views
0

我有一個非常長的HTML,我想使用Cheerio.js進行報廢。 我想以更有效的方式做到這一點,而不僅僅是加載整個HTML,而我只需要從中刪除1個特定標籤。從字符串中只將大部分HTML加載到Cheerio中。 - 效率問題

的標籤是:

<a class="uniqueClass" .....> 
    ... here there might be multiple other tags. 
</a> 

請注意,我不需要幫助,選擇具有Cheerio該標籤和做我的事吧。我只想要一種更高效的加載方式,而不是加載整個大型HTML。

  • 效率非常重要。

感謝您的幫助!

回答

0

自從以來,你一無所知關於請求的資源,直到你有一個響應(它包含所有的源代碼),因此你將無法「選擇/刮擦」只是一個部分/標籤/無論從「沒有」除非你知道/加載一切

+0

這裏是僞代碼的解決方案,但我需要幫助執行: 1.獲取HTML 2.不是加載整個HTML字符串,找到包含您的標籤 3.負載子到Cheerio子路線 – TBE

+0

您可以在Cheerio中加載整個頁面,獲取所需的部分,然後僅用您選擇的部分創建另一個cheerio實例並刪除第一個實例。 – Shanoor

+0

即使你想分割它,找到它裏面的東西,你也需要首先獲取整個源代碼。然後你可以逐行閱讀或做任何你想做的事情。 –